dbo:abstract
|
- La ciència de les dades (també coneguda com a ciència de dades o data science en anglès) és un camp interdisciplinari de mètodes científics, processos i sistemes per extreure informació i coneixement a partir de dades. Fent servir dades estructurades o desesctructurades (veure Mineria de dades), la ciència de les dades és un camp de la ciència que uneix l'estadística, la informàtica i altres camps del coneixement amb l'objectiu final d'entendre i modelar un fenomen. Dins d'aquesta àrea podem trobar altres subcamps com l'aprenentatge automàtic, l'aprenentatge profund, la classificació, l'anàlisi per clústers, la mineria de dades, les bases de dades o la visualització de dades. La ciència de les dades és una nova metodologia focalitzada en convertir dades en accions. Així, enlloc de basar la presa de decisions en la intuïció, aquest camp ofereix eines per optimitzar la presa de decisions mitjançant el coneixement i l'anàlisi dels resultats. La ciència de dades és una eina per informar, no per explicar. Generalment els passos a seguir en aquests processos és: fer-se una pregunta, obtindre les dades, processar-les (netejar-les, agrupar-les, seleccionar-les...), analitzar-les, i finalment, prendre una decisió i actuar. (ca)
- Data science neboli datová věda je interdisciplinární obor, který využívá vědecké metody, procesy, algoritmy a systémy pro získávání znalostí a poznatků z dat v různých podobách, jak strukturovaných, tak nestrukturovaných podobně jako data mining. Data science "sjednocuje statistiku, analýzu dat, strojové učení a související metody" s cílem "pochopit a analyzovat skutečné jevy" na základě dat. Využívá techniky a teorie čerpané z mnoha oblastí matematiky, statistiky, informatiky a matematické informatiky. Nositel Turingovy ceny Jim Gray si data science představoval jako „čtvrté paradigma“ vědy (empirické, teoretické, výpočetní a nyní založené na datech) a tvrdil, že „všechno ve vědě se mění v důsledku vlivu informačních technologií“ a záplavy dat. V roce 2012, kdy Harvard Business Review nazval data science "nejvíce sexy zaměstnáním 21. století" se tento termín stal . To je nyní často používáno zaměnitelně se staršími pojmy jako business analytics, business intelligence, prediktivní modelování, data mining a statistika. Dokonce i myšlenka, že datová věda je sexy, parafrázuje Hanse Roslinga, který v dokumentu BBC 2011 prohlásil: "Statistika je nyní nejvíce sexy téma, které tu máme." označil datovou vědu za sexy termín pro statistiku. V mnoha případech jsou nyní dřívější přístupy a řešení jednoduše přejmenovávány jako data science, aby byly atraktivnější, což může způsobit, že termín se "zředí [...] za hranici užitečnosti". I když mnohé univerzitní programy nyní nabízejí titul v oboru datové vědy, neexistuje konsensus o její definici nebo o obsahu učebních osnov. K diskreditaci data science přispívá mnoho projektů v oblasti datové vědy a velkých dat, které nedokázaly poskytnout užitečné výsledky, často v důsledku špatného řízení a využívání zdrojů. (cs)
- علم البيانات (Data science) علم يغلب عليه تداخل الاختصاصات والذي يقوم على استخدام الأساليب العلمية، والمعالجات والخوارزميات والنظم لاستخراج المعرفة والأفكار من البيانات بشكليها، سواء مُهيكلة، أو غير مهيكلة، بشكل مشابه للتنقيب في البيانات. كما يعتمد علم البيانات على تقنيات تعلم الآلة والذكاء الصناعي وبرامج معالجة البيانات الضخمة. ويُعرف علم البيانات بأنه «مفهوم قائم على توحيد الإحصاء، وتحليل البيانات وتعلم الآلة والوسائل المرتبطة بهم من أجل فهم وتحليل ظاهرة فعلية باستخدام البيانات». وهو يقوم بتوظيف نظريات وأساليب مستمدة من حقول معرفية متعددة في سياق الرياضيات والإحصاء وعلم المعلومات وعلوم الحاسب. يتصور جيم غراي الفائز بجائزة تورينج بأن علم البيانات «نموذج رابع» للعلوم (التجريبية والنظرية والحسابية والآن البيانات)، وأكد أن «كل شيء عن العلوم يتغير بسبب تأثير تكنولوجيا المعلومات» وطوفان البيانات. في عام 2012 حينما أطلقت مجلة بيزنس هارفارد ريفيو على علم البيانات "بأنها الوظيفة الأكثر إثارة في القرن الحادي والعشرين، أصبح علم البيانات عبارة شائعة. وتُستخدم الآن بصفة تبادلية مع المفاهيم السابقة مثل تحليل الأعمال، وذكاء الأعمال، والتحليل التنبؤي، والإحصاء. حتى أن هانز روزلينج أعاد صياغة عبارة علم البيانات المثير، في وثائقي هيئة الإذاعة البريطانية عام 2011 في تلك المقولة: "أصبح الإحصاء الآن أكثر الموضوعات المحيطة بنا إثارة". وأشار نيت سيلفر إلى أن علم البيانات قد جعل من الإحصاء أكثر إثارة. وفي حالات عديدة أعُيد تسمية العديد من المناهج والحلول السابقة بعلم البيانات لكي تصبح أكثر جاذبية. وفي حين تقدم بعض الجامعات حالياً شهادات في علم البيانات، غير أنه لا يوجد توافق في الآراء حول تعريف أو محتويات المناهج المناسبة. (ar)
- Η επιστήμη των Δεδομένων είναι ένα διεπιστημονικό πεδίο του οποίου αντικείμενο είναι η εξαγωγή της γνώσης από αδόμητα ή δομημένα δεδομένα. Αποτελεί τη συνέχεια επιστημών όπως η στατιστική, η ανάλυση προγνωστικών (predictive analytics), η μηχανική μάθηση (machine learning) και η εξόρυξη δεδομένων (data mining).Με τις τεχνολογικές προόδους τις δύο τελευταίες δεκαετίες, σε συνδυασμό, εν μέρη με την έκρηξη του διαδικτύου, έχει προκύψει μια νέα μορφή ανάλυσης δεδομένων. Ο ορισμός του ακριβή ρόλου ενός επιστήμονα δεδομένων περιλαμβάνει ένα συγκεκριμένο υπόβαθρο σε κάποιους επιστημονικούς τομείς αλλά και ένα σύνολο ικανοτήτων που δεν έχουν προσδιοριστεί απολύτως καθώς η συγκεκριμένη επιστήμη αποτελεί το συνδυασμό περισσότερων από τους συνήθεις τομείς έρευνας.Εν γένει, ένας επιστήμονας δεδομένων χρησιμοποιεί τις τρέχουσες υπολογιστικές τεχνικές για την ανάλυση δεδομένων. Οι εκάστοτε ερευνητές, όπως οι στατιστικολογοί, οι φυσικοί, οι βιολόγοι και οι οικονομολόγοι από πάντα αναζητούσαν τη πληροφορία στους αντίστοιχους τομείς έρευνάς τους, πλέον, όμως, η σφαίρα της πληροφορίας έχει αλλάξει, ως εκ τούτου, απαιτείται ένα νέο σύνολο δεξιοτήτων για την αποδοτικότερη ανάλυση των δεδομένων που λαμβάνονται. Παράλληλα, παρατηρείται εκθετική αύξηση της υπολογιστικής ισχύος η οποία παρέχει νέες μεθόδους για να επεξεργαστούν οι συνεχώς αυξανόμενες ποσότητες δεδομένων που συλλέγονται κάθε δευτερόλεπτο της ημέρας. Συνεπώς, κάθε επιστήμονας δεδομένων θα πρέπει να επενδύσει χρόνο να εξοικειωθεί με υπολογιστικές τεχνικές οι οποίες διαχειρίζονται τον όγκο δεδομένων και τη πολυπλοκότητα των δεδομένων σήμερα. Πέρα από τις μαθηματικές και τις στατιστικές γνώσεις, οι υπόλοιπες δεξιότητες ενός επιστήμονα δεδομένων δεν αφορούν έναν μόνο συγκεκριμένο τομέα. (el)
- Datumoj scienco (angle data science) estas interfaka areo dediĉita al la studo kaj analizo de ekonomiaj, financaj kaj sociaj datumoj, strukturitaj kaj nestrukturitaj, celante ĉerpi sciaron, detekti normojn kaj/aŭ akiri komprenojn por eblaj decidadoj. Datuma scienco kiel fako ekzistas ekde antaŭ 30 jaroj, sed ĝi akiris pli da eminenteco en la lastaj jaroj pro faktoroj kiel la apero kaj popularigado de grandaj datumbazoj kaj la disvolviĝo de areoj kiel maŝina lernado. Datumsciencistoj povas labori en la privata sektoro, ekzemple, transformante grandajn kvantojn da krudaj datumoj en komercajn informojn, helpante entreprenojn en decidado por atingi pli bonajn rezultojn aŭ en universitato kaj en la tria sektoro kiel interfakaj kvantaj esploristoj. (eo)
- Data science is an interdisciplinary field that uses scientific methods, processes, algorithms and systems to extract or extrapolate knowledge and insights from noisy, structured and unstructured data, and apply knowledge from data across a broad range of application domains. Data science is related to data mining, machine learning, big data, computational statistics and analytics. Data science is a "concept to unify statistics, data analysis, informatics, and their related methods" in order to "understand and analyse actual phenomena" with data. It uses techniques and theories drawn from many fields within the context of mathematics, statistics, computer science, information science, and domain knowledge. However, data science is different from computer science and information science. Turing Award winner Jim Gray imagined data science as a "fourth paradigm" of science (empirical, theoretical, computational, and now data-driven) and asserted that "everything about science is changing because of the impact of information technology" and the data deluge. A data scientist is someone who creates programming code and combines it with statistical knowledge to create insights from data. (en)
- Data Science (von englisch data „Daten“ und science „Wissenschaft“, im Deutschen auch Datenwissenschaft) bezeichnet generell die Extraktion von Wissen aus Daten, um daraus zu lernen. Data Science ist ein interdisziplinäres Wissenschaftsfeld, welches wissenschaftlich fundierte Methoden, Prozesse, Algorithmen und Systeme zur Extraktion von Erkenntnissen, Mustern und Schlüssen sowohl aus strukturierten als auch unstrukturierten Daten ermöglicht. Erweitert um die zentrale Bedeutung der Datenerfassung unserer Welt (siehe auch DIKW-Pyramide nach Kellerhey und Tierney) und die Visualisierung gewonnener Informationen beschäftigt sich Data Science mit der „exakten digitalen Erfassung, Analyse und Visualisierung vergangener, aktueller sowie zukünftiger Phänomene unserer realen Welt, um datengetrieben den Prozess der Wissensgenerierung als bestmögliche Entscheidungsbasis für menschliches Handeln zu optimieren.“ (de)
- Datu zientzia edo datuen zientzia jakintza erauzteko metodo zientifikoak, prozesuak eta sistemak uztartzen dituen disziplinarteko alorra da. Datuen errepresentaziotik estrategia berrien sormenerako baliabideak lortzeko erabiltzen da. (eu)
- La ciencia de datos es un campo interdisciplinario que, con métodos científicos, extrae conocimiento de datos estructurados o no estructurados. Es una combinación de campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático, y la analítica predictiva. El concepto ciencia de datos reúne estadísticas, análisis de datos, aprendizaje automático, y sus métodos relacionados, para comprender y analizar los fenómenos reales. Emplea técnicas y teorías extraídas de muchos campos dentro del contexto de las matemáticas, la estadística, la ciencia de la información, y la informática. El ganador del premio Turing, Jim Gray, imaginó la ciencia de datos como un "cuarto paradigma" de la ciencia (empírico, teórico, computacional, y ahora basado en datos), y afirmó que "todo lo relacionado con la ciencia está cambiando debido al impacto de la tecnología de la información y el diluvio de datos". En este nuevo paradigma, los investigadores se apoyan de sistemas y procesos que son muy diferentes a los utilizados en el pasado, como son modelos, ecuaciones, algoritmos, así como evaluación e interpretación de resultados. (es)
- La science des données est l'étude de l’extraction automatisée de connaissance à partir de grands ensembles de données. Plus précisément, la science des données est un domaine interdisciplinaire qui utilise des méthodes, des processus, des algorithmes et des systèmes scientifiques pour extraire des connaissances et des idées à partir de nombreuses données structurées ou non . Elle est souvent associée aux données massives et à l'analyse des données. Elle utilise des techniques et des théories tirées de nombreux domaines dans le contexte des mathématiques, des statistiques, de l'informatique, de la théorie et des technologies de l'information, parmi lesquelles : l’apprentissage automatique, la compression de données et le calcul à haute performance. (fr)
- Artikel ini bukan mengenai Ilmu informasi. Ilmu data (bahasa Inggris: data science) adalah suatu disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik), baik yang terstruktur maupun tidak terstruktur. Berbagai subjek yang dibahas dalam ilmu data meliputi semua proses data, mulai dari pengumpulan data, analisis data, pengolahan data, manajemen data, kearsipan, pengelompokan data, penyajian data, distribusi data, hingga cara mengubah data menjadi kesatuan informasi yang dapat dipahami semua orang. Ilmu data merupakan kombinasi dari ilmu sains dan ilmu sosial. Ilmu-ilmu yang menjadi penunjang utama dalam ilmu data terdiri dari matematika, statistika, ilmu komputer, sistem informasi, manajemen, ilmu informasi, termasuk juga ilmu komunikasi dan ilmu perpustakaan, kearsipan, dan dokumentasi. Bahkan ilmu ekonomi, terutama ilmu bisnis, juga berperan penting dalam ilmu data. (in)
- La scienza dei dati è l'insieme di principi metodologici (basati sul metodo scientifico) e di tecniche multidisciplinari volto a interpretare ed estrarre conoscenza dai dati attraverso la relativa fase di analisi da parte di un esperto, chiamato scienziato dei dati (data scientist). I metodi della scienza dei dati (spesso associati al concetto di data mining) si basano su tecniche provenienti da varie discipline, principalmente da matematica, statistica, , informatica e scienze sociali, in particolar modo nei seguenti sottodomini: basi di dati e visualizzazione dati o business intelligence, intelligenza artificiale o apprendimento automatico. Il ruolo di scienziato dei dati è stato definito dalla Harvard Business Review come «la professione più attraente del XXI secolo» ed è considerato uno dei quattro ruoli chiave preposti all'utilizzo sistematico dei big data nelle aziende. (it)
- データサイエンス(英: data science、略称: DS)またはデータ科学とは、データを用いて新たな科学的および社会に有益な知見を引き出そうとするアプローチのことであり、その中でデータを扱う手法である情報科学、統計学、アルゴリズムなどを横断的に扱う。 また、データサイエンスは、統計的、計算的、人間的視点から俯瞰することができる。それぞれの視点がデータサイエンスを構成する本質的な側面であり、これらの3つの視点の有機的結合こそがデータサイエンスという学問の神髄である(Blei and Smyth, 2017)。 これまでのデータ解析における現場の知識の重要性に対する認識不足が、データサイエンスという学問に対する幅広い誤解の源泉であると考えられる(Hernan, Hsu and Healy, 2018)。 データサイエンスは、はっきりとした応用の文脈をもち、超領域性の様相を呈していて、また研究成果に対しては明確な社会的説明責任が求められ、さらに、研究成果の質的保証のためには従来の座学的基準以外に質のコントロールのための追加の基準が必要とされる。 データサイエンスの有効な推進のためには組織の異種混合性も重要である。これらの要件を満たす科学はギボンズらが主張するモード2科学の一種として認識することが出来る。 データサイエンスで使用される手法は多岐にわたり、分野として数学、統計学、計算機科学、情報工学、パターン認識、機械学習、データマイニング、データベース、可視化などと関係する。 データサイエンスの研究者や実践者はデータサイエンティストと呼ばれる。 データサイエンスの応用としては、生物学、医学、工学、経済学、社会学、人文科学などが挙げられる。 (ja)
- 데이터 과학(data science)이란, 데이터 마이닝(Data Mining)과 유사하게 정형, 비정형 형태를 포함한 다양한 데이터로부터 지식과 인사이트를 추출하는데 과학적 방법론, 프로세스, 알고리즘, 시스템을 동원하는 융합분야다. 데이터 과학은 데이터를 통해 실제 현상을 이해하고 분석하는데 통계학, 데이터 분석, 기계학습과 연관된 방법론을 통합하는 개념으로 정의되기도 한다. 데이터의 구체적인 내용이 아닌 서로 다른 성질의 내용이나 형식의 데이터에 공통으로 존재하는 성질, 또는 그것들을 다루기 위한 기술의 개발에 착안점을 둔다는 특징을 가진다. 사용되는 기술은 여러분야에 걸쳐있으며 수학, 통계학, 컴퓨터 과학, 정보공학, 패턴인식, 기계학습, 데이터마이닝, 데이터베이스 등과 관련이 있다. 데이터 과학을 연구하는 사람을 데이터 과학자라고 한다. 튜링상을 수상한 짐그레이(Jim Gray) 박사는 데이터 과학은 과학의 네번째 패러다임으로 정의하고 과학(경험, 이론, 계산, 그리고 이제 데이터)에 관한 모든 것이 바뀌고 있는데 이유는 정보기술과 데이터 범람(data deluge) 때문이라고 주장했다. 데이터 과학은 생물학, 의학, 공학, 사회학, 인문과학 등의 여러 분야에 응용되고 있다. (ko)
- Datawetenschap, vaak ook onvertaald in het Engels: data science, is een interdisciplinair onderzoeksveld met betrekking tot wetenschappelijke methoden, processen en systemen om kennis en inzichten te onttrekken uit (zowel gestructureerde als ongestructureerde) data. Datawetenschap is een concept om statistieken, data-analyse en aanverwante methoden te verenigen. Het maakt gebruik van technieken en theorieën ontleend aan vele disciplines binnen het brede gebied van de wiskunde, statistiek, informatiekunde en computerwetenschappen. In het bijzonder de subdomeinen van machinaal leren, classificatie, cluster-analyse, datamining, databases, en visualisatie zijn belangrijke hulpvakken. Turing awardwinnaar Jim Gray beschouwt datawetenschap als de "vierde" paradigma van de wetenschap, naast empirie, theorievorming en computationaliteit. Hij veronderstelt dat wetenschap verandert vanwege de impact van informatietechnologie en de overvloed aan data. (nl)
- Ciência de dados (em inglês: data science) é uma área interdisciplinar, que localiza-se em uma interface entre a estatística e a ciência da computação, que utiliza o método científico; processos, algoritmos e sistemas, para extrair conhecimento e tomar decisões a partir de dados dos diversos tipos, sendo eles ruidosos, nebulosos, estruturados ou não-estruturados. Sendo assim uma área voltada para o estudo e a análise organizada de dados científicos e mercadológicos, financeiros, sociais, geográficos, históricos, biológicos, psicológicos, dentre muitos outros.Visa, desde modo, a extração de conhecimento, detecção de padrões e/ou obtenção de insights para possíveis tomadas de decisão. Ciência de dados enquanto campo existe há 30 anos, porém ganhou mais destaque nos últimos anos devido a alguns fatores como o surgimento e popularização de grandes bancos de dados e o desenvolvimento de áreas como machine learning. Cientistas de Dados podem trabalhar no setor privado, por exemplo, transformando grande quantidade de dados brutos em insights de negócios, auxiliando empresas em tomadas de decisões para atingir melhores resultados ou na academia e terceiro setor como pesquisadores quantitativos interdisciplinares. Há uma forte relação da área da ciência de dados com a inteligência artificial, uma vez que o principal profissional que lida com o desenvolvimento, manutenção e fiscalização de inteligências artificiais e machine learning são cientistas de dados. (pt)
- Danologia lub z ang. data science – interdyscyplinarne pole używające naukowych metod, procesów, algorytmów i systemów do wydobywania spostrzeżeń z wielu danych strukturalnych i nieustrukturyzowanych. Danologia jest powiązana z eksploracją danych (ang. data mining), uczeniem maszynowym (ang. machine learning) i analizą dużych zbiorów danych (ang. big data). Danologia wykorzystuje statystykę, analizę danych, uczenie maszynowe, wiedzę dziedzinową (ang. domain knowledge) i powiązane metody w celu zrozumienia i analizy danych. (pl)
- Наука про дані — це міждисциплінарна галузь про наукові методи, процеси і системи, які стосуються добування знань із даних у різних формах, як структурованих так і неструктурованих. Наука про дані є продовженням деяких галузей аналізу даних, таких як статистика, класифікація, кластеризація, машинне навчання, добування даних і передбачувальна аналітика. Лауреат Премії Тюрінга Джим Ґрей розглядав науку про дані як «четверту парадигму» науки (поруч з емпіричною, теоретичною та обчислювальною). (uk)
- Наука о данных (англ. data science; иногда даталогия — datalogy) — раздел информатики, изучающий проблемы анализа, и представления данных в цифровой форме. Объединяет методы по обработке данных в условиях больших объёмов и высокого уровня параллелизма, статистические методы, методы интеллектуального анализа данных и приложения искусственного интеллекта для работы с данными, а также методы проектирования и разработки баз данных. Рассматривается как академическая дисциплина, а с начала 2010-х годов, во многом благодаря популяризации концепции «больших данных», — и как практическая межотраслевая сфера деятельности, притом специализация исследователя данных (англ. data scientist — «учёного по данным») с начала 2010-х годов считается одной из самых привлекательных, высокооплачиваемых и перспективных профессий. (ru)
- 数据科学(英語:data science)又称资料科学,是一门利用数据(资料)学习知识的學科,其目标是通过从数据中提取出有价值的部分来生产数据产品,学科范围涵盖了:数据取得、数据处理、数据分析等过程,举凡与數據有关的科学均属数据科学。 数据科学结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。数据科学技术可以帮助我们如何正确的处理数据并协助我们在生物学、社会科学、人类学等领域进行研究调研。此外,数据科学也对商业竞争有极大的帮助。 美国国家标准技术研究所于2015年发表七卷大數據参考框架(NIST Big Data Reference Architecture,NBDRA),于第一卷定义篇中将數據科學定为在、和计算科学之后的第四。 (zh)
|
rdfs:comment
|
- Datumoj scienco (angle data science) estas interfaka areo dediĉita al la studo kaj analizo de ekonomiaj, financaj kaj sociaj datumoj, strukturitaj kaj nestrukturitaj, celante ĉerpi sciaron, detekti normojn kaj/aŭ akiri komprenojn por eblaj decidadoj. Datuma scienco kiel fako ekzistas ekde antaŭ 30 jaroj, sed ĝi akiris pli da eminenteco en la lastaj jaroj pro faktoroj kiel la apero kaj popularigado de grandaj datumbazoj kaj la disvolviĝo de areoj kiel maŝina lernado. Datumsciencistoj povas labori en la privata sektoro, ekzemple, transformante grandajn kvantojn da krudaj datumoj en komercajn informojn, helpante entreprenojn en decidado por atingi pli bonajn rezultojn aŭ en universitato kaj en la tria sektoro kiel interfakaj kvantaj esploristoj. (eo)
- Datu zientzia edo datuen zientzia jakintza erauzteko metodo zientifikoak, prozesuak eta sistemak uztartzen dituen disziplinarteko alorra da. Datuen errepresentaziotik estrategia berrien sormenerako baliabideak lortzeko erabiltzen da. (eu)
- Danologia lub z ang. data science – interdyscyplinarne pole używające naukowych metod, procesów, algorytmów i systemów do wydobywania spostrzeżeń z wielu danych strukturalnych i nieustrukturyzowanych. Danologia jest powiązana z eksploracją danych (ang. data mining), uczeniem maszynowym (ang. machine learning) i analizą dużych zbiorów danych (ang. big data). Danologia wykorzystuje statystykę, analizę danych, uczenie maszynowe, wiedzę dziedzinową (ang. domain knowledge) i powiązane metody w celu zrozumienia i analizy danych. (pl)
- Наука про дані — це міждисциплінарна галузь про наукові методи, процеси і системи, які стосуються добування знань із даних у різних формах, як структурованих так і неструктурованих. Наука про дані є продовженням деяких галузей аналізу даних, таких як статистика, класифікація, кластеризація, машинне навчання, добування даних і передбачувальна аналітика. Лауреат Премії Тюрінга Джим Ґрей розглядав науку про дані як «четверту парадигму» науки (поруч з емпіричною, теоретичною та обчислювальною). (uk)
- 数据科学(英語:data science)又称资料科学,是一门利用数据(资料)学习知识的學科,其目标是通过从数据中提取出有价值的部分来生产数据产品,学科范围涵盖了:数据取得、数据处理、数据分析等过程,举凡与數據有关的科学均属数据科学。 数据科学结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。数据科学技术可以帮助我们如何正确的处理数据并协助我们在生物学、社会科学、人类学等领域进行研究调研。此外,数据科学也对商业竞争有极大的帮助。 美国国家标准技术研究所于2015年发表七卷大數據参考框架(NIST Big Data Reference Architecture,NBDRA),于第一卷定义篇中将數據科學定为在、和计算科学之后的第四。 (zh)
- علم البيانات (Data science) علم يغلب عليه تداخل الاختصاصات والذي يقوم على استخدام الأساليب العلمية، والمعالجات والخوارزميات والنظم لاستخراج المعرفة والأفكار من البيانات بشكليها، سواء مُهيكلة، أو غير مهيكلة، بشكل مشابه للتنقيب في البيانات. كما يعتمد علم البيانات على تقنيات تعلم الآلة والذكاء الصناعي وبرامج معالجة البيانات الضخمة. ويُعرف علم البيانات بأنه «مفهوم قائم على توحيد الإحصاء، وتحليل البيانات وتعلم الآلة والوسائل المرتبطة بهم من أجل فهم وتحليل ظاهرة فعلية باستخدام البيانات». (ar)
- La ciència de les dades (també coneguda com a ciència de dades o data science en anglès) és un camp interdisciplinari de mètodes científics, processos i sistemes per extreure informació i coneixement a partir de dades. Fent servir dades estructurades o desesctructurades (veure Mineria de dades), la ciència de les dades és un camp de la ciència que uneix l'estadística, la informàtica i altres camps del coneixement amb l'objectiu final d'entendre i modelar un fenomen. Dins d'aquesta àrea podem trobar altres subcamps com l'aprenentatge automàtic, l'aprenentatge profund, la classificació, l'anàlisi per clústers, la mineria de dades, les bases de dades o la visualització de dades. (ca)
- Data science neboli datová věda je interdisciplinární obor, který využívá vědecké metody, procesy, algoritmy a systémy pro získávání znalostí a poznatků z dat v různých podobách, jak strukturovaných, tak nestrukturovaných podobně jako data mining. Data science "sjednocuje statistiku, analýzu dat, strojové učení a související metody" s cílem "pochopit a analyzovat skutečné jevy" na základě dat. Využívá techniky a teorie čerpané z mnoha oblastí matematiky, statistiky, informatiky a matematické informatiky. (cs)
- Data Science (von englisch data „Daten“ und science „Wissenschaft“, im Deutschen auch Datenwissenschaft) bezeichnet generell die Extraktion von Wissen aus Daten, um daraus zu lernen. Data Science ist ein interdisziplinäres Wissenschaftsfeld, welches wissenschaftlich fundierte Methoden, Prozesse, Algorithmen und Systeme zur Extraktion von Erkenntnissen, Mustern und Schlüssen sowohl aus strukturierten als auch unstrukturierten Daten ermöglicht. (de)
- Η επιστήμη των Δεδομένων είναι ένα διεπιστημονικό πεδίο του οποίου αντικείμενο είναι η εξαγωγή της γνώσης από αδόμητα ή δομημένα δεδομένα. Αποτελεί τη συνέχεια επιστημών όπως η στατιστική, η ανάλυση προγνωστικών (predictive analytics), η μηχανική μάθηση (machine learning) και η εξόρυξη δεδομένων (data mining).Με τις τεχνολογικές προόδους τις δύο τελευταίες δεκαετίες, σε συνδυασμό, εν μέρη με την έκρηξη του διαδικτύου, έχει προκύψει μια νέα μορφή ανάλυσης δεδομένων. (el)
- Data science is an interdisciplinary field that uses scientific methods, processes, algorithms and systems to extract or extrapolate knowledge and insights from noisy, structured and unstructured data, and apply knowledge from data across a broad range of application domains. Data science is related to data mining, machine learning, big data, computational statistics and analytics. A data scientist is someone who creates programming code and combines it with statistical knowledge to create insights from data. (en)
- La ciencia de datos es un campo interdisciplinario que, con métodos científicos, extrae conocimiento de datos estructurados o no estructurados. Es una combinación de campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático, y la analítica predictiva. En este nuevo paradigma, los investigadores se apoyan de sistemas y procesos que son muy diferentes a los utilizados en el pasado, como son modelos, ecuaciones, algoritmos, así como evaluación e interpretación de resultados. (es)
- La science des données est l'étude de l’extraction automatisée de connaissance à partir de grands ensembles de données. Plus précisément, la science des données est un domaine interdisciplinaire qui utilise des méthodes, des processus, des algorithmes et des systèmes scientifiques pour extraire des connaissances et des idées à partir de nombreuses données structurées ou non . Elle est souvent associée aux données massives et à l'analyse des données. (fr)
- Artikel ini bukan mengenai Ilmu informasi. Ilmu data (bahasa Inggris: data science) adalah suatu disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik), baik yang terstruktur maupun tidak terstruktur. Berbagai subjek yang dibahas dalam ilmu data meliputi semua proses data, mulai dari pengumpulan data, analisis data, pengolahan data, manajemen data, kearsipan, pengelompokan data, penyajian data, distribusi data, hingga cara mengubah data menjadi kesatuan informasi yang dapat dipahami semua orang. (in)
- La scienza dei dati è l'insieme di principi metodologici (basati sul metodo scientifico) e di tecniche multidisciplinari volto a interpretare ed estrarre conoscenza dai dati attraverso la relativa fase di analisi da parte di un esperto, chiamato scienziato dei dati (data scientist). (it)
- 데이터 과학(data science)이란, 데이터 마이닝(Data Mining)과 유사하게 정형, 비정형 형태를 포함한 다양한 데이터로부터 지식과 인사이트를 추출하는데 과학적 방법론, 프로세스, 알고리즘, 시스템을 동원하는 융합분야다. 데이터 과학은 데이터를 통해 실제 현상을 이해하고 분석하는데 통계학, 데이터 분석, 기계학습과 연관된 방법론을 통합하는 개념으로 정의되기도 한다. 데이터의 구체적인 내용이 아닌 서로 다른 성질의 내용이나 형식의 데이터에 공통으로 존재하는 성질, 또는 그것들을 다루기 위한 기술의 개발에 착안점을 둔다는 특징을 가진다. 사용되는 기술은 여러분야에 걸쳐있으며 수학, 통계학, 컴퓨터 과학, 정보공학, 패턴인식, 기계학습, 데이터마이닝, 데이터베이스 등과 관련이 있다. 데이터 과학을 연구하는 사람을 데이터 과학자라고 한다. 튜링상을 수상한 짐그레이(Jim Gray) 박사는 데이터 과학은 과학의 네번째 패러다임으로 정의하고 과학(경험, 이론, 계산, 그리고 이제 데이터)에 관한 모든 것이 바뀌고 있는데 이유는 정보기술과 데이터 범람(data deluge) 때문이라고 주장했다. (ko)
- Datawetenschap, vaak ook onvertaald in het Engels: data science, is een interdisciplinair onderzoeksveld met betrekking tot wetenschappelijke methoden, processen en systemen om kennis en inzichten te onttrekken uit (zowel gestructureerde als ongestructureerde) data. Turing awardwinnaar Jim Gray beschouwt datawetenschap als de "vierde" paradigma van de wetenschap, naast empirie, theorievorming en computationaliteit. Hij veronderstelt dat wetenschap verandert vanwege de impact van informatietechnologie en de overvloed aan data. (nl)
- データサイエンス(英: data science、略称: DS)またはデータ科学とは、データを用いて新たな科学的および社会に有益な知見を引き出そうとするアプローチのことであり、その中でデータを扱う手法である情報科学、統計学、アルゴリズムなどを横断的に扱う。 また、データサイエンスは、統計的、計算的、人間的視点から俯瞰することができる。それぞれの視点がデータサイエンスを構成する本質的な側面であり、これらの3つの視点の有機的結合こそがデータサイエンスという学問の神髄である(Blei and Smyth, 2017)。 これまでのデータ解析における現場の知識の重要性に対する認識不足が、データサイエンスという学問に対する幅広い誤解の源泉であると考えられる(Hernan, Hsu and Healy, 2018)。 データサイエンスは、はっきりとした応用の文脈をもち、超領域性の様相を呈していて、また研究成果に対しては明確な社会的説明責任が求められ、さらに、研究成果の質的保証のためには従来の座学的基準以外に質のコントロールのための追加の基準が必要とされる。 データサイエンスの有効な推進のためには組織の異種混合性も重要である。これらの要件を満たす科学はギボンズらが主張するモード2科学の一種として認識することが出来る。 データサイエンスの研究者や実践者はデータサイエンティストと呼ばれる。 (ja)
- Ciência de dados (em inglês: data science) é uma área interdisciplinar, que localiza-se em uma interface entre a estatística e a ciência da computação, que utiliza o método científico; processos, algoritmos e sistemas, para extrair conhecimento e tomar decisões a partir de dados dos diversos tipos, sendo eles ruidosos, nebulosos, estruturados ou não-estruturados. Sendo assim uma área voltada para o estudo e a análise organizada de dados científicos e mercadológicos, financeiros, sociais, geográficos, históricos, biológicos, psicológicos, dentre muitos outros.Visa, desde modo, a extração de conhecimento, detecção de padrões e/ou obtenção de insights para possíveis tomadas de decisão. Ciência de dados enquanto campo existe há 30 anos, porém ganhou mais destaque nos últimos anos devido a alg (pt)
- Наука о данных (англ. data science; иногда даталогия — datalogy) — раздел информатики, изучающий проблемы анализа, и представления данных в цифровой форме. Объединяет методы по обработке данных в условиях больших объёмов и высокого уровня параллелизма, статистические методы, методы интеллектуального анализа данных и приложения искусственного интеллекта для работы с данными, а также методы проектирования и разработки баз данных. (ru)
|