TY - JOUR TI - Success Rates in Most-frequent-word-based Authorship Attribution. A Case Study of 1000 Polish Novels from Ignacy Krasicki to Jerzy Pilch AU - Rybicki, Jan TI - Success Rates in Most-frequent-word-based Authorship Attribution. A Case Study of 1000 Polish Novels from Ignacy Krasicki to Jerzy Pilch AB - W artykule zbadano skuteczność atrybucji autorskiej opartej na wielowymiarowej analizie najczęstszych słów w korpusie 1000 powieści polskich napisanych między końcem XVIII i początkiem XXI wieku. Oceniono wpływ liczby autorów i/lub tekstów na uzyskane wyniki. Porównano skuteczność atrybucji w niniejszej pracy z wynikami uzyskanymi we wcześniejszych opracowaniach wykorzystujących mniejsze korpusy – a więc te, które mogły nie wykazywać regularnych prawidłowości pod tym względem. Wykazano, że w dużych kolekcjach tekstów sprawdzają się intuicyjne przypuszczenia: 1) im więcej autorów, tym trudniej o skuteczną atrybucję; 2) przy tej samej liczbie autorów liczba tekstów nie ma wpływu na skuteczność atrybucji. VL - Volume 10 (2015) IS - Vol. 10, Issue 2 PY - 2015 SN - 1732-8160 C1 - 2300-5920 SP - 87 EP - 104 DO - 10.4467/23005920SPL.15.004.3561 UR - https://ejournals.eu/czasopismo/studies-in-polish-linguistics/artykul/success-rates-in-most-frequent-word-based-authorship-attribution-a-case-study-of-1000-polish-novels-from-ignacy-krasicki-to-jerzy-pilch KW - analiza wielowymiarowa KW - atrybucja autorska KW - literatura polska KW - stylometria