Web content mining

Web content mining (en gren af data mining eller text mining) kan defineres som ”at finde og udtrække data og information fra websider”. Fordi websider er meget forskellige i struktur og indhold, har Ankiro udviklet sprogteknologiske værktøjer der kan identificere og udtrække de informationer der er relevante for kunden. Det er muligt pga. Ankiros ordbøger og ontologier.

Web content mining

Ankiro har eksempelvis udviklet en jobportal til Fagjob (et samarbejde mellem Danmarks 11 største forbund og a-kasser med tilsammen ca. 800.000 medlemmer). Ankiro crawler dagligt det danske hjørne af internettet og identificerer sider som jobopslag, udtrækker oplysninger automatisk (stillingsbetegnelse, ansøgningsfrist, ansættelsesdato, arbejdsgiver m.m.), frasorterer udløbne jobopslag og dubletter og samler alle jobopslagene i en database. Denne samling jobopslag leveres også til andre kunder (Jobnet, Jobzonen, Workindenmark m.fl.)

Opgaven med at udvælge og analysere jobopslag automatisk og gøre dem søgbare er mulig pga. Ankiros ordbøger og ontologier. Ordbøgerne og ontologierne bruges også i den One Line Search Ankiro har udviklet til Fagjobs jobportal.

Fagjobs jobportal har en søster, Kursusportalen. Her kan Fagjobs brugere søge efter erhvervsrelevante kurser og efteruddannelser i hele Danmark, på tværs af alle udbydere og hjemmesider. Kurserne er crawlet, ligesom jobopslagene i jobportalen, og også her anvender vi ordbogs- og ontologibaseret web content mining.

Kontakt os

Vil du høre mere om hvordan Ankiro kan hjælpe dig med web content mining, så kontakt os på telefon 33 27 97 00, eller skriv en mail til salg@ankiro.dk. Vi glæder os til at tale med dig.