Частота використання символів як компонент статистичного профілю ідіолекту новелістики М. Яцкова

Автор(и)

DOI:

https://doi.org/10.28925/2412-2491.2025.2512

Ключові слова:

текстовий корпус, текстовий масив, ідіолект автора, послідовні вибірки, ентропія, мелодійність тексту

Анотація

Стаття присвячена квантитативному аналізу художнього тексту на графологічному та фонетичному рівні. Дослідження проводиться на матеріалі експериментального дослідницького корпусу новел М. Яцкова. Для проведення статистичних досліджень на рівні символів (графем) з новел М. Яцкова було утворено текстовий масив. Обраховано абсолютну (кількість) та відносну частоту кожного символу розширеної української абетки у цілому текстовому масиві. За отриманими частотами для кожного символу було визначено його ранг та пораховано ентропію за відповідною формулою у текстовому масиві в цілому, для випадково послідовних та вибраних сегментів тексту довжиною 108 символів. Для цілого текстового масиву та окремо для послідовно і випадково вибраних сегментів було обраховано розподіл символів за типами та милозвучність тексту. Милозвучність визначали як відсоток сукупності голосних, сонорних та дзвінких букв. За результатами проведених обчислень було проаналізовано відповідність частот символів у цілому тексті та вибраних сегментах. За теоретичне підґрунтя було взято критерій згоди К. Пірсона . За гіпотетичну теоретичну функцію розподілу було  прийнято частотний розподіл символів у дослідницькому масиві тексту. Для кожного вибраного сегменту обчислювали статистику критерію Пірсона. За нульову гіпотезу   прийняли твердження: «у тексті-вибірці розподіл частот символів розширеної української абетки не відрізняється від відповідного розподілу в тексті-репрезентанті». Паралельно для тексту-вибірки визначено ранг кожного символу в частотному розподілі. Всі обчислення виконано за допомогою власних програм на мові Python. Отримані результати порівняно з аналогічними для новел Василя Стефаника. Доведено, що при випадковому виборі сегменту, розмір якого становить навіть одну соту обсягу тексту, можна отримати з високою вірогідністю частоту символів у всьому тексті. Показано, що для новели як жанру зі стійкими жанротворчими елементами в певних часових рамках конкретної національної літератури (Яцків – Стефаник) лінгвостатистичні показники будуть мати мінімальне розходження.

 

Завантаження

Дані завантаження ще не доступні.

Посилання

Karasov, V., & Levchenko, O. (2022). Statistical characteristics of O. Zabuzhko’s idiolect. 2022 IEEE 17th International Conference on Computer Sciences and Information Technologies (CSIT), 138–141. IEEE. https://doi.org/10.1109/CSIT56902.2022.10000546

Kryvuliak, O. V. (2007). Transformatsiia estetyky symvolizmu v novelakh M. Yatskova, O. Pliushcha, I. Lypy [Transformation of the aesthetics of symbolism in the novellas of M. Yatskov, O. Pliushch, and I. Lypy] (Author’s abstract of PhD dissertation). Kyiv: Taras Shevchenko National University of Kyiv. (in Ukrainian)

Kulchytskyi, I. (2019a). Okremi aspekty kvantytatyvnykh doslidzhen ukrayinskoyi movy [Certain aspects of quantitative studies of the Ukrainian language]. Ukraina Moderna, 27, 73–96. https://doi.org/10.3138/ukrainamoderna.27.073

Kulchytskyi, I. (2019b). Statistical analysis of the short stories by Roman Ivanychuk. In Proceedings of the 3rd International Conference on Computational Linguistics and Intelligent Systems (COLINS-2019) (Vol. I, pp. 312–321).

Lototska, N., & Saban, O. (2023). R. Ivanychuk’s idiolect: Quantitative parameterization of the language used in the text. 2023 IEEE 18th International Conference on Computer Science and Information Technologies (CSIT), 1–4. IEEE. https://doi.org/10.1109/CSIT61576.2023.10324093

Loukas, O., & Chung, H. R. (2022). Entropy-based characterization of modeling constraints. arXiv. https://doi.org/10.48550/arXiv.2206.14105

Melnyk, O. O. (2011). Modernistskyi fenomen Mykhaila Yatskova: Kanon ta interpretatsiia [The modernist phenomenon of Mykhailo Yatskov: Canon and interpretation]. Kyiv: Naukova dumka. (in Ukrainian)

Naumenko, A. M. (2003). Blukanina suchasnoho perekladu: vid hlukhoho kuta semiotyky do hlukhoho kuta kohnityvnoi linhvistyky [The wandering of modern translation: From the dead end of semiotics to the dead end of cognitive linguistics]. Nova filolohiia, (3)18, 203. (in Ukrainian)

National Institute of Standards and Technology. (n.d.). Critical values of the chi-square distribution. Retrieved September 28, 2025, from https://www.itl.nist.gov/div898/handbook/eda/section3/eda3674.htm

Oakes, M., & Farrow, M. (2007). Use of the chi-squared test to examine vocabulary differences in English-language corpora representing seven different countries. Literary and Linguistic Computing, 22(1), 85–99. https://doi.org/10.1093/llc/fql044

Pavlyshenko, O. (2004). Markery avtorsʹkoho idiolekta v leksyko-semantychnykh poliakh diiesliv anhlomovnoi khudozhnoi prozy [Markers of the author’s idiolect in the lexico-semantic fields of verbs in English-language fiction]. Mova i kulʹtura, 7(4, Pt. 2), 314–315. (in Ukrainian)

Selivanova, O. O. (2008). Suchasna linhvystyka: napriamy ta problemy [Modern linguistics: Directions and problems]. Poltava: Dovkillia. (in Ukrainian)

Seminck, O., Gambette, P., Legallois, D., & Poibeau, T. (2022). The evolution of the idiolect over the lifetime: A quantitative and qualitative study of French 19th century literature. Journal of Cultural Analytics, 7(3), 1–24. https://doi.org/10.22148/001c.37588

Stelmakh, B. (2004). Indyvidualʹnyi stylʹ yak obʺiekt linhvostylistychnykh doslidzhenʹ [Individual style as an object of linguistic-stylistic research]. Visnyk Umansʹkoho Peduniversytetu. Seriia: Filolohiia (Movoznavstvo), 228–233. (in Ukrainian)

Tkachuk, O. (2013). Naratyvni pryntsypy prozy Mykhaila Yatskova [Narrative principles of Mykhailo Yatskov’s prose] (Monograph). Ternopil: Medobory. (in Ukrainian)

Yatskiv, M. (2016). Chorni kryla. Lviv: Piramida. (in Ukrainian)

Downloads


Переглядів анотації: 21

Опубліковано

2025-12-01

Як цитувати

Tsiokh, L., & Shyika, Y. (2025). Частота використання символів як компонент статистичного профілю ідіолекту новелістики М. Яцкова. Studia Philologica, (2 (25), 170–183. https://doi.org/10.28925/2412-2491.2025.2512

Номер

Розділ

Мовознавство