Модифікований метод виявлення фейкових новин на основі алгоритмів машинного навчання
Анотація
Об’єктом дослідження є процес аналізу інформації в соціальних медіа для виявлення фейкових новин. Предметом дослідження є розроблення програмного забезпечення алгоритмічно-програмного методу для виявлення фейкових новин. Мета роботи полягає у підвищенні середньої точності процесу виявлення фейкових новин у соціальних медіа шляхом розробки та реалізації алгоритмічно-програмного методу виявлення фейкових новин на основі алгоритмів машинного навчання. Використано різноманітні методи наукових досліджень: аналізу – для з’ясування переваг та недоліків існуючих методів виявлення фейкових новин; порівняння – при виборі найбільш оптимальної мови програмування та середовища програмування для розробки програмного забезпечення для виявлення фейкових новин; метод огляду актуальної літератури з виявлення фейкових новин, включаючи академічні публікації, технічні звіти та онлайнресурси; метод експертної оцінки, за допомогою якого було отримано інформацію щодо ефективності різних методів виявлення фейкових новин. Завдяки використанню цих методів було отримано комплексне розуміння проблеми виявлення фейкових новин та розроблено ефективне програмне забезпечення для виявлення фейкових новин. Наукова новизна роботи полягає в тому, що було запропоновано модифікований алгоритмічно-програмний метод виявлення фейкових новин на основі алгоритмів машинного навчання, який відрізняється від наявних методів використанням ансамблю з трьох алгоритмів, результати кожного з яких використовуються для вибору компактніших спеціалізованих моделей для наступних алгоритмів, що в підсумку дозволяє пришвидшити процес виявлення фейкових новин у тексті на 30 %, порівнюючи з аналогами, а також зменшити середню хибність на 25 %. Практична цінність отриманих у роботі результатів полягає в тому, що розроблене програмне забезпечення алгоритмічно-програмного методу для виявлення фейкових новин сприятиме зменшенню поширення фейків та допомогатиме їх виявленню
Ключові слова
алгоритмічно-програмний метод; алгоритми машинного навчання; методи виявлення та розпізнавання фейків; BERT; LSTM; Passive-Aggressive Classifier
Використані джерела
[1] A. Sanzharovsky, and V. Yurchyshyn, "Algorithmic-software method for detecting fake news based on machine learning algorithms", on Fifteenth Sci. Conf. of Undergraduates and Graduate Students Applied Mathematics and Computing (PMK-2022), Kyiv, Nov. 16-18, pp. 499-504, 2022 [in Ukrainian].
[2] Study: On Twitter, false news travels faster than true stories. [Online]. Available: https://news.mit.edu/2018/study-twitterfalse-news-travels-faster-true-stories-0308. Accessed on: Jan. 20, 2023.
[3] Disinformation risk assessment: The online news market in the United States. [Online]. Available: https://www.disinformationindex.org/country-studies/ 2022-12-16-disinformation-risk-assessmentthe-online-news-market-in-the-unitedstates/. Accessed on: Jan. 20, 2023.
[4] H. Alcott, and M. Gentzkow, "Social media and fake news in the 2016 election", Journal of Economic Perspectives, vol. 31 (2), pp. 211-236. doi: 10.1257/jep.31.2.211.
[5] K. Shu, A. Sliva, S. Wang, J. Tang, and H. Liu, "Fake news detection on social media: A data mining perspective", ACM SIGKDD Explorations Newsletter, vol. 19, iss. 101, pp. 22-36, Sept. 2017. doi: 10.1145/3137597.3137600.
[6] K. Sharma, F. Qian, H. Jiang, and N. Ruchansky, "Combating fake news: A survey on identification and mitigation techniques", ACM Transactions on Intelligent Systems and Technology, vol. 10 (3), pp. 1-42, Apr. 2019. [Online]. Available: https://www.researchgate.net/publication/332434399_Combating_Fake_News_A_Survey_on_Identification_and_Mitigation_ Techniques. Accessed on: Jan. 20, 2023.doi: 10.1145/3305260.
[7] B. D. Horne, and S. Adali, "This just in: Fake news packs a lot in title, uses simpler, repetitive content in text body, more similar to satire than real news", ArXiv abs/1703.09398, 2017. [Online]. Available: https://www.semanticscholar.org/paper/This -Just-In%3A-Fake-News-Packs-a-Lot-inTitle%2C-Uses-Horne-Adali/f8366afaf58 bbb9db151a1168bb6f14b618955b4. Accessed on: Jan. 20, 2023.
[8] D. Rothman, "Transformers for natural language processing: Build innovative deep neural network architectures for NLP with Python, PyTorch, TensorFlow, BERT, RoBERTa, and more"; Birmingham, UK: Packt Publishing Ltd. Birmingham Mumbai, 2021.
[9] P. Bahad, P. Saxena, and R. Kamal, "Fakenews detection using bi-directional LSTMrecurrent neural network", ProcediaComput. Sci., vol. 165, pp. 74-82, 2019.[Online]. Available: https://doi.org/10.1016/j.procs.2020.01.072. Accessed on: Jan. 20,2023
[10] S. M. Padnekar, G. S. Kumar, and P. Deepak, "Bilstm-autoencoder architecture for stance prediction", in Proc. 2020 Int. Conf. on Data Science and Engineering (ICDSE), Kochi, India, pp. 1-5, Dec. 3-5, 2020.
[11] E. Amer, K.-S. Kwak, and S. El-Sappagh, "Context-based fake news detection model relying on deep learning models". Electronics, vol. 11 (8), p. 1255, 2022. [Online]. Available: https://doi.org/10.3390/ electronics11081255. Accessed on: Jan. 20, 2023
[12] A. Malakhov, A. Patruno, and S. Bocconi, "Fake news classification with BERT". [Online]. Available: http://ceur-ws.org/ Vol-2882/paper38.pdf. Accessed on: Jan. 20, 2023.
[13] D. Jacob, C. Ming-Wei, L. Kenton, and T. Kristina, "BERT: Pre-training of deep bidirectional transformers for language understanding". [Online]. Available: https://arxiv.org/pdf/1810.04805.pdf. Accessed on: Jan. 20, 2023.
[14] Fake News Detection Using PassiveAggressive Classifier. [Online]. Available: https://link.springer.com/chapter/10.1007/97 8-981-15-7345-3_13. Accessed on: Jan. 20, 2023.
[15] D. Arthur, and S. Vassilvitskii, "k-means++: The advantages of careful seeding". [Online]. Available: https://theory.stanford.edu/~sergei/ papers/kMeansPP-soda.pdf. Accessed on: Jan. 20, 2023..
[16] D. P. Kingma, and J. L. Ba, "Adam: A method for stochastic optimization". [Online]. Available: https://arxiv.org/abs/ 1412.6980. Accessed on: Jan. 20, 2023.