%0 Journal Article %T Success Rates in Most-frequent-word-based Authorship Attribution. A Case Study of 1000 Polish Novels from Ignacy Krasicki to Jerzy Pilch %A Rybicki, Jan %J Studies in Polish Linguistics %V Volume 10 (2015) %R 10.4467/23005920SPL.15.004.3561 %N Vol. 10, Issue 2 %P 87-104 %K analiza wielowymiarowa, atrybucja autorska, literatura polska, stylometria %@ 1732-8160 %D 2015 %U https://ejournals.eu/czasopismo/studies-in-polish-linguistics/artykul/success-rates-in-most-frequent-word-based-authorship-attribution-a-case-study-of-1000-polish-novels-from-ignacy-krasicki-to-jerzy-pilch %X W artykule zbadano skuteczność atrybucji autorskiej opartej na wielowymiarowej analizie najczęstszych słów w korpusie 1000 powieści polskich napisanych między końcem XVIII i początkiem XXI wieku. Oceniono wpływ liczby autorów i/lub tekstów na uzyskane wyniki. Porównano skuteczność atrybucji w niniejszej pracy z wynikami uzyskanymi we wcześniejszych opracowaniach wykorzystujących mniejsze korpusy – a więc te, które mogły nie wykazywać regularnych prawidłowości pod tym względem. Wykazano, że w dużych kolekcjach tekstów sprawdzają się intuicyjne przypuszczenia: 1) im więcej autorów, tym trudniej o skuteczną atrybucję; 2) przy tej samej liczbie autorów liczba tekstów nie ma wpływu na skuteczność atrybucji.