@article{af57daeb-c9c3-41c0-9a8b-dba165663334, author = {Szymon Łukasik, Marcin Haręza, Marcin Kaczor}, title = {Document content mining for authors' identification task}, journal = {Czasopismo Techniczne}, volume = {2013}, number = {Automatyka Zeszyt 1-AC (2) 2013}, year = {2013}, issn = {0011-4561}, pages = {3-15},keywords = {identyfikacja autora; wybór cech; klasyfikacja}, abstract = {Eksploracja treści dokumentów w problemie identyfikacji autorów Przedmiotem niniejszego artykułu jest problem identyfikacji autora na podstawie analizy treści dokumentów. Podejście to opiera się na wyborze odpowiednich cech związanych ze specyficznym użyciem struktur gramatycznych, interpunkcji oraz słownika, a następnie – użycie wybranego algorytmu klasyfikacji. W artykule przedstawiono najpierw różne charakterystyki tekstu, które mogą być użyte w omawianym zagadnieniu, a następnie załączono wyniki eksperymentów obliczeniowych obejmujących wybór cech i badanie skuteczności klasyfikacji w problemie identyfikacji autorów. Artykuł podsumowano wnioskami oraz propozycjami dalszych prac w rozważanej tematyce badawczej.}, doi = {10.4467/2353737XCT.14.001.1989}, url = {https://ejournals.eu/czasopismo/czasopismo-techniczne/artykul/document-content-mining-for-authors-identification-task} }