- Головна
- 10-11 клас
- 1.1 Аналіз даних
- Звідки взялося так багато даних?
Звідки взялося так багато даних?
Дані є майже скрізь у нашому повсякденному житті та зростають у геометричній прогресії. Згідно з оцінками, кількість цифрових даних, які існують сьогодні, подвоїться в найближчі кілька років.
Тому в майбутньому нам знадобиться більше професіоналів у таких темах, як основи науки про дані, великі дані та аналітика даних.
Звідки беруться дані?
Основним джерелом створення цифрових даних є людина: ми надсилаємо електронні листи, відповідаємо на опитування, пишемо програми, авторизуємося на сайтах, робимо покупки в інтернет-магазинах і користуємося банкінгом онлайн, проходимо медичні обстеження, користуємось електронними квитками тощо. Кожен цифровий слід є даними, які можна обробляти.
А другу частину даних створюють комп’ютери в інформаційних системах, які можуть не лише обробляти та аналізувати те, що ми залишили, а й генерувати нові.
Наприклад, з однієї заповненої форми, де вказано вік, професію та адресу, можна знайти середній прибуток в регіоні та почати надсилати пропозиції з певними вакансіями.
Існує і третій тип даних: дані, які генеруються комп’ютерним шляхом реєстрації застосунків і поведінки систем і мережевих пристроїв. Вони зазвичай зберігаються у вигляді напівструктурованих log-файлів або бінарних файлів і достатньо складно аналізуються, але мають велику цінність для встановлення зв’язків між подіями, що часто допомагає бізнесам ухвалювати рішення швидше і краще.
Типи згенерованих людиною і комп’ютерами даних дуже різні: до текстів приєднуються зображення, відео, бінарні файли тощо.