Tarkvara tehnoloogia arenduskeskuse projektijuhi Raul Sireli sõnul erineb TEXTA teistest tarkvaradest, kuna kohaneb hästi suurte andmemahtudega. 

Sa oled siin

TEXTA Toolkit leiab andmetest nende peidetud väärtuse

Tarkvara tehnoloogia arenduskeskus lõi vabatekstiliste suurandmete tõhusamaks analüüsimiseks TEXTA Toolkit’i, mis aitab vabatekstidest küllastunud valdkondades, nagu meditsiin ja õigusteadus, andmeid lihtsamini hallata.   

Praegu valmis olev TEXTA on tulevase andmetöötluse programmi prototüüp. Tarkvara tehnoloogia arenduskeskuse projektijuhi Raul Sireli sõnul erineb TEXTA teistest tarkvaradest, kuna kohaneb hästi suurte andmemahtudega. See tähendab, et tarkvara töökindlus võimaldab analüüsides kasutada sadu miljoneid tekstidokumente. Lisaks on tarkvara keelest sõltumatu, mistõttu on TEXTA kättesaadav ka näiteks Läti ettevõtetele.  

„Kui keegi kirjutab „juudid ahju“, siis ütleb meie süsteem, et see ei ole õige kommentaar,“ kirjeldas Sirel programmi tööd.

Sirel tõi välja, et sõnapõhisest otsingust tööriista puhul ei piisa. Inimesed väänavad keelt ja kasutavad sageli sünonüüme. Selleks töötas Sirel neljaliikmelise meeskonnaga välja lisa, mis võimaldab andmetest õppida, kuidas inimesed sõnu kasutavad. Nimelt töötab TEXTA sama algoritmi põhjal kui Google, mis arvutab välja, kuivõrd sarnased on sõnad. Seejärel hakkab programm ise soovitama, millised sõnad on kasutaja poolt sisestatule sarnased. Nii ei pea inimene enda pead sõnade tuletamisega vaevama.  

Arenduskeskus lõi masinõpet kasutades Õhtulehele uue kommentaariumi lahenduse, mis suudab tuvastada ohtlikke kommentaare. „Kui keegi kirjutab „juudid ahju“, siis ütleb meie süsteem, et see ei ole õige kommentaar,“ kirjeldas Sirel programmi tööd. Kui aga kommentaar on kaheldava väärtusega, läheb see moderaatorile kontrolli. 

Õhtulehe IT juhi Urmas Talivee sõnul rakendub uus kommentaarium lähima aja jooksul kõigis Õhtulehe portaalides. Lisaks tõi Talivee välja, et Õhtulehe eesmärk on kommentaariumit väiksema vaevaga puhas hoida. 

Derlingi advokaadibüroo koos vandeadvokaat Hannes Vallikiviga on testinud TEXTA võimekust õiguse valdkonnas. Tema arvamusel on tarkvara suurim väärtus hetkel kohtulahendites korra loomisel. Vallikivi lisas, et kuigi TEXTA on alles arengujärgus, kaaluks tema selle praeguse versiooni rakendamist büroo igapäevatöös. Seda aga juba sõltuvalt toote hinnast. Samas tõi Vallikivi välja, et õigusvaldkonna jaoks kohandatud TextaLaw nimeline arendus võiks jätkuda selliselt, et tekiks üks koht, kus näiteks advokaadid leiavad endale vajalikud väljavõtted mingit küsimust reguleerivatest õigusnormidest.  

Eestis tegeleb suurandmete töötlemisega ka FeelingStream. Selle asutaja Terje Ennomäe sõnul pakub FeelingStream erinevalt TEXTAst aga konkreetset toodet, mida kasutavad näiteks kontaktikeskused. Toode asetseb ettevõtte infosüsteemis ja analüüsib regulaarselt sissetulevaid e-kirju. Kuna TEXTA pakub praegu pigem ühekordset analüüsiteenust, leidis Ennomäe, et programm on FeelingStreamist erinev. Ta lisas, et alati on tervitatud ka konkurents.  

 

Märksõnad: 
Uudised

Lisa kommentaar