Преглед говора у текст Ватсон-а: Најбоља услуга транскрипције великог обима? -.

Преглед садржаја:

Anonim

Ватсон је ИБМ-ов рачунарски систем за обраду природног језика. Омогућава чувени суперкомпјутер са одговорима на питања, као и серију корпоративних производа заснованих на АИ, укључујући Ватсон Спеецх то Тект. У нашем прегледу говора у текст Ватсон, погледаћемо једну од најбољих апликација за претварање говора у текст, идеалну за свакога ко жели да аудио претвори у текст у опсегу.

Ватсон платформа за обраду говора доступна је на ИБМ Цлоуд-у. То је свестран алат и може се користити у многим контекстима, укључујући диктирање и транскрипцију конференцијског позива. Штавише, за разлику од већине других апликација за претварање говора у текст, доступан је као АПИ, омогућавајући програмерима да га, између осталог, уграде у системе за контролу гласа.

Вотсонов говор у текст: планови и цене

Ватсон Говор у текст можете користити за бесплатну обраду до 500 минута звука месечно. Ако желите да конвертујете више од тога, мораћете да платите за сваки аудио минут и цена се мења на основу трајања обрађеног звука. Трошкови се крећу од 0,01 до 0,02 УСД по минути, а додатни трошак износи 0,03 УСД по минути ако вам је потребан ИБМ-ов прилагођени језички модел. Доступни су и премиум тарифни планови компаније Ватсон који омогућавају приступ побољшаним функцијама приватности података и гаранцијама за непрекидну употребу.

Вотсонова услуга говора у текст одређује се на основу обима садржаја који треба да препишете.

Такође можете приступити систему Ватсон Говор у текст путем опште намене ИБМ Цлоуд претплате. Обрада природног језика је само једна апликација у широком спектру АИ услуга коју можете добити путем ИБМ Цлоуд-а, тако да је ово добра опција за сваку организацију којој је потребан приступ брзом преносу података, цхат-овима или алатима за претварање текста у говор.

Вотсонов говор у текст: Карактеристике

Захваљујући флексибилној интеграцији АПИ-ја и другим претходно изграђеним ИБМ алатима, услуга препознавања говора Ватсон иде далеко даље од основне транскрипције. Ако желите да га користите у контексту корисничке службе, на пример, Ватсон Ассистант може да се подеси тако да директно обрађује питања на природном језику или одговара на упите телефоном.

У Вотсону је ИБМ саставио платформу за обраду природних језика богату могућностима.

Ватсон ради са звуком уживо на 11 језика и може да увози звукове у разним унапред снимљеним форматима. Током стримовања, дијагностичка подршка у реалном времену значи да Ватсон може подстаћи кориснике да се приближе микрофону или промене своје окружење. Такође је импресивна чињеница да Ватсон може да разликује различите звучнике у заједничком разговору захваљујући Спеакер Диаризатион, функцији која је још увек у фази бета тестирања.

Ватсон Говор у текст: Постављање

Да бисте користили Ватсон, прво што требате је да направите ИБМ Блуемик налог. Регистрација је бесплатна и безболна, захтевају само адресу е-поште и лозинку. Једном пријављени, на свој налог морате додати одредбу за услугу Говор у текст. У овој фази ћете добити неколико акредитива које бисте требали да сачувате у својој евиденцији.

Регистрација за ИБМ Блуемик налог је неопходна да би се добио приступ Ватсон-овом комплетном скупу функција.

Након што то учините, ствари постају знатно сложеније. Да бисте приступили Ватсон-у, мораћете да додате те акредитиве у серију кода клијентског јединственог локатора ресурса (цУРЛ) и затим га покренете на рачунару. Да бисте сазнали тачно коју наредбу да позовете, погледајте овај приручник. Ако желите само да видите колико добро функционише Ватсон систем, а да не морате да прескачете све те обруче, можете га испробати на ИБМ-овој демо локацији.

Вотсонов говор у текст: сучеље

За разлику од апликација за претварање гласа у текст које су окренуте потрошачима, Ватсоновим услугама је дизајнирано да им се приступи преко АПИ-ја и кода уграђених у друге системе. Из тог разлога не постоји прави Вотсонов „интерфејс“. Уместо тога, Вотсону се може приступити преко три различита интернет протокола. То су ВебСоцкетс, РЕСТ АПИ и Ватсон Девелопер Цлоуд.

Вотсоновим говором у текст може се управљати путем Ватсон Девелопер Цлоуд система.

Да бисте контролисали Вотсона, мораћете да користите алатку за командну линију која се повезује са ИБМ-овим облаком путем једне од те три руте. Интерфејс који крајњи корисник у интеракцији са Ватсоном види мораће да изгради неко из вашег развојног тима одвојено.

Ватсон Говор у текст: Перформанс

Свеукупно, импресионирао нас је начин на који се ова платформа за обраду природног језика бавила стварним говором. Користили смо Вотсона за преписивање клипова које смо снимали у читавом низу изазовних окружења, као и звучних записа познатих говора одржаних на неколико од 11 подржаних Вотсонових језика.

Открили смо да се Вотсон добро показао са унапред снимљеним говором.

Иако су грешке постајале чешће за клипове са пуно позадинске буке, Ватсон је генерално давао невероватно тачне резултате. На основу наших тестова проценили смо да се неизрековане грешке у просеку догађају само једном на сваких 150 речи. Међутим, постало је јасно зашто Ватсон-ова функција диаризације звучника остаје у БЕТА тестирању, јер је неколико пута током наше процене један глас погрешно означен као засебни звучници.

Ватсон Говор у текст: Подршка

ИБМ-ов ресурсни центар нуди обиље документације да бисте боље разумели како применити Ватсон на ваш специфичан случај употребе. Такође је вредно користити АПИ-интеграције и СДК-ове које је креирала заједница програмера Ватсон и поставила на ГитХуб.

Страница Ватсон АПИ ГитХуб је добар извор подршке за услугу Ватсон Спеецх то Тект.

Ако тамо не пронађете решење за свој проблем, можете директно да се обратите ИБМ-у тако што ћете отворити карту за подршку или их контактирати телефоном. Све док сте се одлучили за један од премиум Ватсон пакета, ваша употреба Ватсона биће заштићена Уговором о нивоу услуге.

Ватсон Говор у текст: Коначна пресуда

Ако ваша организација има знање и ресурсе за правилну интеграцију платформе ИБМ Ватсон Спеецх то Тект у ваш систем, користиће вам напредне функције попут дијагностике звучног окружења у стварном времену и привремених резултата транскрипције. Међутим, мала предузећа и организације ће се борити са техничким изазовом правилног постављања Вотсона.

Такмичење

Услуга ИБМ Ватсон Спеецх то Тект директна је конкуренција услугама масовне транскрипције Гоогле Цлоуд Спеецх-то-Тект и Амазон Трансцрибе. Обоје су знатно јефтиније од Вотсона, са Гоогле Цлоуд транскрипцијом, на пример, почев од 0,006 долара по минути. Све три услуге имају сличне функције, попут прилагођеног речника, али једна карактеристика која ИБМ Ватсону јако недостаје, али је доступна код оба конкурента, јесте аутоматско препознавање интерпункције.

Тражите друго решење за претварање текста у текст? Погледајте наш најбољи водич за претварање говора у текст.