ИСПОЛЬЗОВАНИЕ РАЗВЕДОЧНОГО АНАЛИЗА ДАННЫХ ДЛЯ ВЫДВИЖЕНИЯ ГИПОТЕЗ НА ПРИМЕРЕ РЫНКА КРОССОВОК
Аннотация
Анализ данных - это процесс изучения и интерпретации данных с целью извлечения значимых выводов и информации. Анализ данных может быть применен в различных областях, включая бизнес, здравоохранение, науку и технологии. Например, в бизнесе анализ данных может помочь выявить тенденции и закономерности в поведении клиентов, в то время как в здравоохранении он может помочь в диагностике и лечении заболеваний. Анализ данных включает в себя множество приёмов и методологий, например, статистический анализ, интеллектуальный анализ данных и другие. Процесс исследования данных, где мы получаем их первоначальное понимание, характеристики и свойства, называется разведочным анализом данных (exploratory data analysis, EDA). Основные шаги EDA включают в себя: описание данных, визуализацию данных, проверку на пропущенные значения, проверку на выбросы и аномалии, анализ корреляции между переменными и построение моделей для предсказания будущих значений. На примере данных о рынке кроссовок, в статье использовался разведочный анализ данных с помощью которого можно наглядно выдвигать гипотезы
Библиографические ссылки
Анализ данных. Учебное пособие – М.: Мир науки, 2019. – Сетевое издание. Режим доступа: https://izd-mn.com/PDF/32MNNPU19.pdf
Набор анализируемых данных «Shoeprice» [Электронный ресурс]// – 2023. – Режим доступа: https://www.kaggle.com/datasets/rkiattisak/shoe-prices-dataset
Базовые возможности языка Python для анализа данных : учеб.-метод. пособие / С. В. Рындина. – Пенза : Изд-во ПГУ, 2022. – 72 с.