%0 Journal Article %T Document content mining for authors' identification task %A Łukasik, Szymon %A Haręza, Marcin %A Kaczor, Marcin %J Czasopismo Techniczne %V 2013 %R 10.4467/2353737XCT.14.001.1989 %N Automatyka Zeszyt 1-AC (2) 2013 %P 3-15 %K identyfikacja autora, wybór cech, klasyfikacja %@ 0011-4561 %D 2013 %U https://ejournals.eu/czasopismo/czasopismo-techniczne/artykul/document-content-mining-for-authors-identification-task %X Eksploracja treści dokumentów w problemie identyfikacji autorów Przedmiotem niniejszego artykułu jest problem identyfikacji autora na podstawie analizy treści dokumentów. Podejście to opiera się na wyborze odpowiednich cech związanych ze specyficznym użyciem struktur gramatycznych, interpunkcji oraz słownika, a następnie – użycie wybranego algorytmu klasyfikacji. W artykule przedstawiono najpierw różne charakterystyki tekstu, które mogą być użyte w omawianym zagadnieniu, a następnie załączono wyniki eksperymentów obliczeniowych obejmujących wybór cech i badanie skuteczności klasyfikacji w problemie identyfikacji autorów. Artykuł podsumowano wnioskami oraz propozycjami dalszych prac w rozważanej tematyce badawczej.