Интеллектуальный анализ данных (Data Mining)
Заказать уникальный реферат- 15 15 страниц
- 13 + 13 источников
- Добавлена 05.01.2021
- Содержание
- Часть работы
- Список литературы
- Вопросы/Ответы
Аннотация…………………………………………………………………..2
Введение……………………………………………………………….........4
Ключевые концепции интеллектуального анализа данных……………...5
Преимущества интеллектуального анализа данных……………………...6
Работа интеллектуального анализа данных……………………………....7
Примеры использования интеллектуального анализа данных…………..9
Будущее интеллектуального анализа данных…………………………...10
ПО и инструменты интеллектуального анализа данных……………….12
Интеллектуальный анализ данных и статистика………………………..13
Заключение……………………………………………………………….. 14
Список литературы………………………………………………………..15
Интеллектуальный анализ данных и статистикаПоскольку организации по-прежнему завалены огромными объемами данных, им необходима способность извлекать нужную информацию с той скоростью, которая требуется их бизнесу.Компании в любой отрасли полагаются на интеллектуальный анализ данных, чтобы ускорить получение требуемых аналитических данных. Существует много общего между интеллектуальным анализом данных и статистики. Фактически, большинство методов, используемых при интеллектуальном анализе данных, можно поместить в статистическую структуру. Однако методы интеллектуального анализа данных отличаются от традиционных статистических методов.Традиционные статистические методы, как правило, требуют значительного взаимодействия с пользователем для проверки правильности модели. В результате статистические методы трудно автоматизировать. Более того, статистические методы обычно плохо масштабируются для очень больших наборов данных. Статистические методы основаны на проверке гипотез или нахождении корреляций на основе более мелких репрезентативных выборок из большей совокупности.Методы интеллектуального анализа данных подходят для больших наборов данных и их легче автоматизировать. Фактически, алгоритмы интеллектуального анализа данных часто требуют больших наборов данных для создания качественных моделей.Данные могут быть добыты независимо от того, хранятся ли они в каких либофайлах, электронных таблицах, таблицах баз данных или в другом формате хранения. Важным критерием для данных является не формат хранения, а его применимость к решаемой проблеме.Правильная сортировка и подготовка данных очень важны для интеллектуального анализа данных, и хранилище данных может облегчить эти действия. Однако хранилище данных бесполезно, если оно не содержит данных, необходимых для решения поставленной задачи.Интеллектуальный анализ данных – мощный инструмент, который может помочь найти закономерности и взаимосвязи в данных. Но интеллектуальный анализ данных не работает сам по себе. Это не отменяет необходимости знать свой бизнес, понимать свои данные или понимать аналитические методы. Интеллектуальный анализ данных обнаруживает скрытую информацию в данных, но не может сказать ценность информации для вашей организации.Важно помнить, что предсказательные отношения, обнаруженные с помощью интеллектуального анализа данных, не обязательно являются причинами действия или поведения. Например, интеллектуальный анализ данных может определить, что мужчины с доходом от 50000 до 65000 долларов США, которые подписываются на определенные журналы, вероятно, купят данный продукт. Можно использовать эту информацию, чтобы разработать маркетинговую стратегию. Однако не следует предполагать, что население, идентифицированное с помощью интеллектуального анализа данных, купит какой-либопродукт, потому что оно принадлежит к конкретной группе населения.ЗаключениеИнтеллектуальный анализ данных не позволяет автоматически находить решения без правильного подхода. Шаблоны, которые будутобнаружены при интеллектуальном анализе данных, будут сильно отличаться в зависимости от того, как формулируется задача.Чтобы получить значимые результаты, нужно научиться задавать правильные вопросы. Например, вместо того, чтобы пытаться узнать, как «улучшить отклик на предложение почтовой рассылки», лучше попытаться определить характеристику людей, которые отвечали на запросы в прошлом.Для обеспечения значимых результатов интеллектуального анализа данных, важно понимать свои данные. Алгоритмы интеллектуального анализа данных часто чувствительны к определенным характеристикам данных:выбросы (значения данных, которые сильно отличаются от типичных значений в текущей базе данных), нерелевантные столбцы, столбцы, которые различаются вместе (например, возраст и дата рождения), кодирование данных и данные, которые выбираются для включения или исключения. С помощьюDataMiningможно автоматически выполнять большую часть подготовки данных, требуемой алгоритмом. Часть подготовки данных может быть довольно специфична для задач интеллектуального анализа данных. В любом случае необходимо понимать данные, которые использовались для построения модели, чтобы правильно интерпретировать результаты при применении модели.Конкурентные преимущества, которые дает DataMining, позволяют получить полезные результаты, для которых требуются детальные знания данных и длительные проверки методом проб и ошибок.Специалисты, чувствующие высокий коммерческий потенциал средств DataMining, видят влияние технологии на прибыльность бизнесаи перспективы для расширения границ применения данной технологии.СписоклитературыBrynjolfsson, E. and A. McAfee (2014), The Second Machine Age: Work, Progress, and Prosperity in a Time ofBrilliant Technologies, New York: W.W. Norton and Company.Büchi, M., N. Just and M. Latzer (2015), ‘Modeling the second-level digital divide: A five-countrystudy of social differences in Internet use’, New Media & Society (published online 9 September, doi:10.1177/1461444815604154).Cambini, C. and Y. Jiang (2009), ‘Broadband investment and regulation: A literature review’, TelecommunicationsPolicy, 33 (10–11), 559–74.Armstrong, M. (2006), ‘Competition in two-sided markets’, RAND Journal of Economics, 37 (3), 668–91.Bauer, J.M., G. Madden and A. Morey (2014), ‘Effects of economic conditions and policy interventions onOECD broadband adoption’, Applied Economics, 46 (12), 1361–72.Börner, K., S. Sanyal and A. Vespignani (2008), ‘Network science’, Annual Review of Information Science andTechnology, 41 (1), 537–607.Brandenburger, A.M. and B.J. Nalebuff (1996), Co-opetition, New York: Currency Doubleday.Bresnahan, T.F. and M. Trajtenberg (1995), ‘General purpose technologies: “engines of growth”?’, Journal ofEconometrics, 65 (1), 83–108.Briglauer, W. (2014), ‘The impact of regulation and competition on the adoption of fiber-based broadbandservices: Recent evidence from the European union member states’, Journal of Regulatory Economics, 46 (1),51–79.Diamandis, P.H. and S. Kotler (2015), Bold: How to Go Big, Create Wealth, and Impact the World, New York:Simon & Schuster.Dutton, W.H. (ed.) (2013), The Oxford Handbook of Internet Studies, Oxford, UK: Oxford University Press.Easley, D. and J. Kleinberg (2010), Networks, Crowds, and Markets: Reasoning About a Highly Connected World,Cambridge, UK: Cambridge University Press.Cortada, J.W. (2001), 21st Century Business: Managing and Working in the New Digital Economy, Upper SaddleRiver, NJ: Financial Times/Prentice Hall.Coyle, D. (1997), The Weightless World: Strategies for Managing the Digital Economy, Cambridge, MA: MITPress.CSTB (2002), Bringing Home the Bits, Washington, DC: National Research Council, Computer Science andTelecommunications Board.Economides, N. (2005), ‘The economics of the Internet backbone’, in S. Majumdar, I. Vogelsang andM. Cave (eds), Handbook of Telecommunications Economics, Volume 2: Technology Evolution and theInternet, Amsterdam: Elsevier, pp.375–412.
Brynjolfsson, E. and A. McAfee (2014), The Second Machine Age: Work, Progress, and Prosperity in a Time of Brilliant Technologies, New York: W.W. Norton and Company.
Büchi, M., N. Just and M. Latzer (2015), ‘Modeling the second-level digital divide: A five-country study of social differences in Internet use’, New Media & Society (published online 9 September, doi: 10.1177/1461444815604154).
Cambini, C. and Y. Jiang (2009), ‘Broadband investment and regulation: A literature review’, Telecommunications Policy, 33 (10–11), 559–74.
Armstrong, M. (2006), ‘Competition in two-sided markets’, RAND Journal of Economics, 37 (3), 668–91.
Bauer, J.M., G. Madden and A. Morey (2014), ‘Effects of economic conditions and policy interventions on OECD broadband adoption’, Applied Economics, 46 (12), 1361–72.
Börner, K., S. Sanyal and A. Vespignani (2008), ‘Network science’, Annual Review of Information Science and Technology, 41 (1), 537–607.
Brandenburger, A.M. and B.J. Nalebuff (1996), Co-opetition, New York: Currency Doubleday.
Bresnahan, T.F. and M. Trajtenberg (1995), ‘General purpose technologies: “engines of growth”?’, Journal of Econometrics, 65 (1), 83–108.
Briglauer, W. (2014), ‘The impact of regulation and competition on the adoption of fiber-based broadband services: Recent evidence from the European union member states’, Journal of Regulatory Economics, 46 (1), 51–79. Diamandis, P.H. and S. Kotler (2015), Bold: How to Go Big, Create Wealth, and Impact the World, New York: Simon & Schuster.
Dutton, W.H. (ed.) (2013), The Oxford Handbook of Internet Studies, Oxford, UK: Oxford University Press. Easley, D. and J. Kleinberg (2010), Networks, Crowds, and Markets: Reasoning About a Highly Connected World, Cambridge, UK: Cambridge University Press.
Cortada, J.W. (2001), 21st Century Business: Managing and Working in the New Digital Economy, Upper Saddle River, NJ: Financial Times/Prentice Hall.
Coyle, D. (1997), The Weightless World: Strategies for Managing the Digital Economy, Cambridge, MA: MIT Press.
CSTB (2002), Bringing Home the Bits, Washington, DC: National Research Council, Computer Science and Telecommunications Board.
Economides, N. (2005), ‘The economics of the Internet backbone’, in S. Majumdar, I. Vogelsang and M. Cave (eds), Handbook of Telecommunications Economics, Volume 2: Technology Evolution and the Internet, Amsterdam: Elsevier, pp.375–412.
Вопрос-ответ:
Что такое интеллектуальный анализ данных?
Интеллектуальный анализ данных (Data Mining) - это процесс автоматического обнаружения интересных и ранее неизвестных паттернов в больших объемах данных.
Какие ключевые концепции связаны с интеллектуальным анализом данных?
Ключевыми концепциями интеллектуального анализа данных являются: обнаружение шаблонов, ассоциативные правила, классификация, кластеризация, прогнозирование и выборка данных.
Какие преимущества предоставляет интеллектуальный анализ данных?
Интеллектуальный анализ данных позволяет обнаруживать скрытые закономерности, оптимизировать бизнес-процессы, предсказывать будущие события, принимать информированные решения и улучшать результаты работы организации.
Как происходит работа интеллектуального анализа данных?
Работа интеллектуального анализа данных включает в себя следующие этапы: сбор данных, предварительная обработка данных, выборка данных, построение моделей, оценка и интерпретация результатов, применение результатов в практической деятельности.
Можете привести примеры использования интеллектуального анализа данных?
Примеры использования интеллектуального анализа данных включают: прогнозирование спроса на товары, выявление мошеннических операций на банковских счетах, анализ социальных сетей для предсказания поведения пользователей, оптимизация производственных процессов и многое другое.
Какие ключевые концепции связаны с интеллектуальным анализом данных?
Ключевые концепции интеллектуального анализа данных включают в себя понятия обработки больших данных, машинного обучения, статистического моделирования, искусственного интеллекта и многих других. Эти концепции объединяются для создания интеллектуальных алгоритмов, которые позволяют находить скрытые закономерности, отношения и паттерны в больших объемах данных.
Какие преимущества предлагает интеллектуальный анализ данных?
Интеллектуальный анализ данных предлагает несколько преимуществ. Во-первых, он позволяет обрабатывать большие объемы данных, которые не могут быть обработаны вручную. Во-вторых, он автоматизирует процесс анализа данных, что упрощает и ускоряет работу специалистов. В-третьих, он обнаруживает скрытые закономерности в данных, которые могут быть использованы для принятия более осознанных решений и предсказания будущих событий.
Как работает интеллектуальный анализ данных?
Интеллектуальный анализ данных работает путем применения различных алгоритмов и методов к набору данных. Начиная с предварительной обработки данных, такой как очистка и преобразование данных, затем применяются алгоритмы машинного обучения и статистического моделирования для выявления закономерностей и паттернов. Затем полученные результаты могут быть интерпретированы и использованы для принятия решений или для создания предсказательных моделей.
Можете привести примеры использования интеллектуального анализа данных?
Интеллектуальный анализ данных может быть использован во многих областях. Например, он может использоваться в маркетинге для анализа предпочтений и поведения потребителей, в медицине для обнаружения паттернов заболеваемости или в финансовой сфере для прогнозирования рынков. Также он может применяться для улучшения процессов в производстве, оптимизации логистики и многих других случаях, где необходимо обработать большие объемы данных и выявить скрытые закономерности.