Страницы Миллбурнского клуба, 1 - страница 88
он время отвремениживет в квартиреМирумова ипосвящаетему своипервые произведения.Какие-либоизменения вписательскомстилеШолохова междупервой ивторойчастямиповести «Путь-дороженька»,опубликованнойв 1925 году,представляютсямаловероятными.
Послепредварительнойобработкитекста повести«Путь-дороженька»(включающей,в частности,удалениеимен собственных)мы разбиликаждую частьповести на 30равныхчастей по 2000байт каждая.Средние безусловныесложности



График1.Интер-ССС График 2. Интра-ССС
Деталивычисленийтаковы: мыпосчитали 30 интер-CCC(кусок части 2плюс часть 1целиком) и 30 интра-CCC(кусок части 1плюсостающийсятекст части 1). Средняяинтер-CCC:







Это t-значениепри числестепенейсвободы 58делаетсоответствующеезначение P (тоесть вероятностьтакого же илибольшегоCCC-отклонения),равнымпримерно

Замечание.В нашихвычисленияхмы предполагали,что интер-CCCразличныхкусков текстанезависимы.Нампредставляетсяэто разумнойаппроксимацией.Интра-CCC могутиметьнебольшуюкорреляцию.Например,выборочныйкоэффициенткорреляциимежду первымипятнадцатьюи последнимипятнадцатьюинтра-CCC части 1равен только0.156. Такая маленькаякорреляцияне можетзначительноизменить t-критерий.
Нашивычисления t-критерияпо двумвыборкамговорят отом, что двечастинаписаныразнымиавторами (длядовольновысокогоуровнязначимости).Результаттакого независимогоотсодержанияисследованияподтверждаетсяаналогичнымзаключениемс помощьюлингвистическогоанализа в работеБар-Селлы [1].Следуетподчеркнуть,что результатыэтих двухисследованийоснованы наразличныхсвойствахтекста и,таким образом,взаимноподтверждаютдруг друга.
АвторыблагодарныЗеевуБар-Селле засовет по выборуприложения иприсылкуоригинальноготекстаповести.
Цитированнаялитература
1.Бар-Селла, З. (2005).Литературныйкотлован:проект «ПисательШолохов»,Российскийгосударственныйгуманитарныйуниверситет.
2. Марусенко,М.А., Бессонов,Б.А.,Богданова,Л.М., Аникин, М.А.,Мясоедова,Н.Е. (2001). Впоискахпотерянногоавтора, Изд-воФилологическогофакультетаСПбГУ.
3. Kolmogorov, A.N. (1965). Threeapproaches to the quantitative definition of information, Problems ofinformation transmission, 1, 3–11.
4.Малютов, М.Б. (2005).Атрибуцияавторстватекстов:Обзор. Обзорыпоприкладной ипромышленнойматематике, 12, No.1, 2005, 41 – 77.
5. Malyutov, M.B., Wickramasinghe, C. I., Li, S. (2007).Conditional Complexity of Compression for Authorship Attribution, SFB 649Discussion Paper No. 57, Humboldt University, Berlin.
6.Малютов, М.,Бродский, С. (2011).Атрибуцияавторстватекстов,Материалымеждународнойнаучнойконференции «В.В.Налимов –математик ифилософ, к 100-летиюсо днярождения».
7.Малютов, М.Б.,Бродский, С. (2009).MDL-процедурадляатрибуцииавторства текстов,Обозрениеприкладной ипромышленнойматематики,том 16, вып. 1, 25 – 34.
8. Ryabko, B., Astola, J. Malyutov, М.(2010). Compression-Based Methods of Prediction and Statistical Analysis ofTime Series: Theory and Applications. Tampere International Center for Signal Processing. TICSP series No. 56, ISBN 978-952-15-2444-8, ISSN 1456 – 2774,115 pages.
9.Хмелев, Д.В. (2001).Сложностнойподход кзадачеопределенияавторстватекста,Тезисыконгресса «Русскийязык», Фак. филологииМГУ, 426 – 427.
10. Cilibrasi, R., Vitanyi, P. (2005). Clustering byCompression, IEEE Trans. Inform. Th., IT-51, 1523 – 1545.

Любовьи кровьНиколаяОлейникова *