@article{9f5fbd5d-797f-4fa6-8444-7c327b8447e5, author = {Jan Rybicki}, title = {Success Rates in Most-frequent-word-based Authorship Attribution. A Case Study of 1000 Polish Novels from Ignacy Krasicki to Jerzy Pilch}, journal = {Studies in Polish Linguistics}, volume = {Volume 10 (2015)}, number = {Vol. 10, Issue 2}, year = {2015}, issn = {1732-8160}, pages = {87-104},keywords = {analiza wielowymiarowa; atrybucja autorska; literatura polska; stylometria}, abstract = {W artykule zbadano skuteczność atrybucji autorskiej opartej na wielowymiarowej analizie najczęstszych słów w korpusie 1000 powieści polskich napisanych między końcem XVIII i początkiem XXI wieku. Oceniono wpływ liczby autorów i/lub tekstów na uzyskane wyniki. Porównano skuteczność atrybucji w niniejszej pracy z wynikami uzyskanymi we wcześniejszych opracowaniach wykorzystujących mniejsze korpusy – a więc te, które mogły nie wykazywać regularnych prawidłowości pod tym względem. Wykazano, że w dużych kolekcjach tekstów sprawdzają się intuicyjne przypuszczenia: 1) im więcej autorów, tym trudniej o skuteczną atrybucję; 2) przy tej samej liczbie autorów liczba tekstów nie ma wpływu na skuteczność atrybucji.}, doi = {10.4467/23005920SPL.15.004.3561}, url = {https://ejournals.eu/czasopismo/studies-in-polish-linguistics/artykul/success-rates-in-most-frequent-word-based-authorship-attribution-a-case-study-of-1000-polish-novels-from-ignacy-krasicki-to-jerzy-pilch} }