• Translation
  • Entity recognition
  • Classification

Fordítás

Neurális gépi fordítás

A neurális gépi fordítás olyan automatikus fordítási eljárás, amelynek során a gép megpróbálja leképezni a forrásszöveg jelentését egy nyelvtől független szinten, majd ezt a szintet „újrafogalmazza” a célnyelven. Sokkal kevésbé kötődik szószinten és strukturálisan a forrásszöveghez, és éppen ezért sokkal kevesebb szórendi és ragozási/egyeztetési hibát vét, mint például a statisztikai gépi fordítás.

A.N.I.T.A. gépi fordítási képességei elsősorban tömeges fordítási igény esetén hasznosíthatók, vagy olyan nyelvek fordításánál, melyek ismerete ritka, így nehezen biztosítható a humán fordítás. Hatalmas tömegű dokumentumokat tömegesen képes lefordítani olyan minőségben, hogy azok témája, kulcsfogalmai megérthetők legyenek.

Entitáskinyerés

Nevesített entitás kinyerés

Az entitáskinyerés strukturálatlan szövegből képes kinyerni a kereshető nevesített entitásokat. Gyakorlati használatnál sokféle valós kérdés megválaszolására alkalmas, például hogy tartalmazza-e egy tweet egy személy nevét és tartózkodási helyét, hogy megneveztek-e egy adott céget egy újsághíradásban, vagy hogy említettek-e egy adott terméket egy értékelésben. A modellek pontozása a felidézésen (recall) és a pontosságon (accuracy) alapul.

Amennyiben a nevesített kifejezésekből végtelenül sokféle lehetséges, mint például a címek, szervezetek nevei, személyek, helyszínek vagy olyan szerepkörök szerinti, nehezen definiálható fogalmak, mint „bejelentő”, „érintett személy” stb. , akkor használható A.N.I.T.A. mesterséges intelligenciája, amely a neki adott minták alapján jó aránnyal ismeri fel ezeket a nehezen körülírható kifejezéstípusokat is.

Kategorizálás

Osztályozási algoritmus

Az osztályozás vagy kategorizálás során a bemeneti szöveget a gép feldolgozza, értelmezi, majd a szókapcsolatokat, mondatkörnyezetet, szóhasználatot és még sok más a tanulás során megtanult változót figyelembe véve besorolja az egyes előre definiált kategóriákba. Ebből kifolyólag a tanítás során már rögzíteni kell, hogy milyen kategóriák közül választhat a gép.

A.N.I.T.A. a beérkező nagymennyiségű írásos anyagokról minták alapján elsajátítja az adott szervezetben mely dokumentumok milyen kategóriákba valók és ezek mentén képes azokat felcímkézni.

Kategória bármi lehet A.N.I.T.A. számára, amit a megrendelő meghatároz. Egy dokumentumhoz akár egyszerre több is köthető, amely kifejezheti az adott dokumentum típusát, témáját, vagy a benne foglaltak jellegét.

© 2019 - Stratis Analytics

All rights reserved

Contact Us