TY - JOUR TI - Document content mining for authors' identification task AU - Łukasik, Szymon AU - Haręza, Marcin AU - Kaczor, Marcin TI - Document content mining for authors' identification task AB - Eksploracja treści dokumentów w problemie identyfikacji autorów Przedmiotem niniejszego artykułu jest problem identyfikacji autora na podstawie analizy treści dokumentów. Podejście to opiera się na wyborze odpowiednich cech związanych ze specyficznym użyciem struktur gramatycznych, interpunkcji oraz słownika, a następnie – użycie wybranego algorytmu klasyfikacji. W artykule przedstawiono najpierw różne charakterystyki tekstu, które mogą być użyte w omawianym zagadnieniu, a następnie załączono wyniki eksperymentów obliczeniowych obejmujących wybór cech i badanie skuteczności klasyfikacji w problemie identyfikacji autorów. Artykuł podsumowano wnioskami oraz propozycjami dalszych prac w rozważanej tematyce badawczej. VL - 2013 IS - Automatyka Zeszyt 1-AC (2) 2013 PY - 2013 SN - 0011-4561 C1 - 2353-737X SP - 3 EP - 15 DO - 10.4467/2353737XCT.14.001.1989 UR - https://ejournals.eu/czasopismo/czasopismo-techniczne/artykul/document-content-mining-for-authors-identification-task KW - identyfikacja autora KW - wybór cech KW - klasyfikacja