Text Mining

QUICK INFO: CU 2h / LAB 1h / 7,5 CREDITE

PROGRAMA ANALITICA

METODA DE EVALUARE

Nota se va primi pe un proiect SAU pe un eseu.

Proiectul nu necesita prezentari intermediare, dar e de preferat totusi sa-l aduceti o data si inainte de finalul anului, ca in cazul in care nu sunteti pe drumul bun sa aveti timp sa corectati.

Eseul va contine un review al diverselor metode folosite de-a lungul timpului in rezolvarea unei anumite probleme. Eseurile se vor prezenta in timpul ultimului curs si laborator, in fata colegilor si a domnului profesor. Nota va fi aflata pe loc, impreuna cu motivatia acordarii ei.

Cursul va trata 5 subiecte mari:

  • Text categorization (by topic)
  • Spam filtering
  • Authorship identification
  • Sentiment analysis, opinion mining
  • Plagiarism detection

Fiecare student trebuie sa se prezinte cat mai curand in timpul orelor de laborator (miercuri 16-18, lab 315 sau daca dl profesor nu se afla in laborator, il cautati la catedra sala 323) si sa spuna de care din cele cinci subiecte ar dori sa se ocupe si daca doreste proiect sau eseu.
Cerintele pentru proiect vor fi personalizate in functie de cunostintele studentului (de ex. cele referitoare la Machine Learning).
Tema de eseu va fi restransa la ceva foarte specific.

Ca materiale, avem partea a doua din cartea folosita si la Regasirea Informatiei (http://nlp.stanford.edu/IR-book/), iar pe masura ce avansam cu materia vom primi suportul de curs si alte resurse.

BIBLIOGRAFIE

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License