• Kiến thức
  • Kỹ năng
  • Nghề nghiệp
  • Công cụ hỗ trợ
  • Luật doanh nghiệp

Video

Business Analysis

Đăng ký nhận tin

 

Ý kiến học viên

  • Nguyễn Thị Mai Bình

    Business Analyst
    Với một người ngoại đạo như mình thì những chuyên đề về "kỹ thuật" của BA hết sức quan trọng. Ví dụ như sử dụng các diagram để mô hình hóa requirement, viết User Story/Use case, v...v..
     
    Đến với khóa học Fundamental Business Analysis, mình đã được gặp thầy Lộc, một người người rất nhiệt tình và có tâm. Ngoài việc chia sẻ các kinh nghiệm thực tế trên lớp thì thầy còn dành thời gian ra để tư vấn, hỗ trợ, góp ý CV cho mình. Bên cạnh đó trung tâm và anh Phụng cũng hỗ trợ gửi CV, kết nối học viên tới mạng lưới các công ty đối tác chất lượng, điều này giúp học viên như mình tìm được công việc phù hợp nhất. Cảm ơn BAC.
    Xem chi tiết +
  • Phạm Quế

    Business Analyst

    Khoá học Product Design của BAC đã cung cấp cho tôi nhiều kiến thức và nền tảng vô cùng hữu ích. Giảng viên giảng dạy rất nhiệt tình, truyền cho chúng tôi ngọn lửa đam mê và nhiệt huyết trong ngành. Đồng thời chia sẻ các kiến thức và kỹ năng cần thiết trong bài giảng một cách dễ hiểu hơn. Số lượng học viên không quá nhiều nên chất lượng giảng giạy vô cùng tốt. Giảng viên sửa bài tập 1-1 nên bài giảng sẽ chuyên sâu hơn.

    Xem chi tiết +
  • Nguyễn Văn Long

    Chuyên viên về chế độ kế toán & Giải pháp nghiệp vụ Tài chính kế toán trong ứng dụng CNTT - Tập đoàn Điện lực Việt Nam (EVN)

    Tôi đã tham gia khóa Phân tích nghiệp vụ phần mềm cơ bản 3.0 tại BAC. Ở đây, tài liệu đào tạo cung cấp nhiều nội dung bổ ích và trình bày dễ hiểu. Giảng viên rất nhiệt tình, ngoài nội dung giảng dạy theo giáo trình còn chia sẻ nhiều kinh nghiệm thực tiễn, các câu hỏi của học viên đều được giải đáp ngay trên lớp và có minh họa từ các dự án trong thực tế. Sau tất cả, tôi cảm ơn BAC và Thầy giáo Thái Sơn.

    Xem chi tiết +
BAC TRAINING & CONSULTANCY VN BAC TRAINING & CONSULTANCY VN BAC TRAINING & CONSULTANCY VN
Language  
Điện thoại tư vấn0909 310 768
Facebook Youtube Linkedin

Jun 26, 2022

Sự khác nhau giữa Data Mining và Data Science

Trong số tất cả các thuật ngữ kỹ thuật, Data Science (khoa học dữ liệu) và Data Mining (khai thác dữ liệu) có lẽ được nhắc đến nhiều nhất trong thế giới dữ liệu. Bài viết này sẽ giúp bạn phân biệt giữa hai thuật ngữ thông qua những sự khác nhau giữa chúng.

1. Data Science là gì?

Thuật ngữ Data Science có thể bắt nguồn từ năm 1974, khi Peter Naur đề xuất nó như một tên thay thế cho computer science (khoa học máy tính), thì thực sự John Tukey, vào năm 1962, người đã mô tả một lĩnh vực giống với khoa học dữ liệu hiện đại và gọi nó là data analysis (dữ liệu phân tích).

Năm 1997, C.F. Jeff Wu cho rằng thống kê nên được đổi tên thành data science. Vào năm sau, Chikio Hayashi lập luận rằng khoa học dữ liệu phải là một khái niệm liên ngành hoàn toàn mới bao gồm ba khía cạnh là thiết kế dữ liệu (data design), thu thập dữ liệu (data collection) và phân tích dữ liệu (data analysis).

Data Science là một lĩnh vực liên ngành liên quan đến việc sử dụng các phương pháp khoa học, thuật toán, quy trình và hệ thống để chiết xuất kiến ​​thức và hiểu biết sâu sắc từ một lượng lớn dữ liệu có cấu trúc và phi cấu trúc. Điều này được sử dụng để xây dựng các mô hình phân tích dự đoán, chỉ định và mô tả.

Data Science liên quan đến Big data (dữ liệu lớn), deep learning (học sâu) và khai thác dữ liệu. Nó là sự giao thoa giữa dữ liệu và máy tính, bao gồm đào, nắm bắt (xây dựng mô hình), phân tích (xác thực mô hình) và sử dụng dữ liệu (triển khai mô hình tốt nhất). Data science kết hợp kinh doanh với khoa học máy tính và thống kê.

2. Các bước trong quy trình của Data Science

Có 6 bước trong quy trình của Data Science bao gồm:

  • Đóng khung vấn đề: Trước khi giải quyết một vấn đề, điều quan trọng là phải biết vấn đề đó là gì, câu hỏi dữ liệu trước tiên phải được chuyển sang câu hỏi kinh doanh có thể hành động.
  • Thu thập dữ liệu thô cần thiết cho vấn đề: Dữ liệu bắt buộc phải được thu thập để có được thông tin chi tiết và giải pháp khả thi bằng cách quét cơ sở dữ liệu nội bộ hoặc mua cơ sở dữ liệu từ các nguồn bên ngoài.
  • Xử lý dữ liệu để phân tích: Dữ liệu phải được xử lý trước khi đi sâu hơn và phân tích nó để có thông tin chi tiết chính xác hơn.
  • Khám phá dữ liệu: Bước quan trọng này liên quan đến việc phát triển các ý tưởng để giúp xác định các mô hình và thông tin chi tiết ẩn.
  • Thực hiện phân tích chuyên sâu: Trong giai đoạn này, các công cụ khoa học dữ liệu và kiến ​​thức toán học, thống kê và công nghệ phải được triển khai để thu thập dữ liệu thành công, đồng thời khám phá và rút ra mọi thông tin chi tiết có thể cũng như các yếu tố quan trọng khác. Dữ liệu định lượng và định tính có thể được kết hợp và chuyển sang hoạt động.
  • Truyền đạt kết quả phân tích: Trong bước này, những hiểu biết sâu sắc và phát hiện được truyền đạt cho trưởng bộ phận bán hàng để giúp họ hiểu tầm quan trọng của những phát hiện và cách chúng có thể giúp tăng trưởng kinh doanh.
3. Các ứng dụng của Data Science

Một số ứng dụng của Data Science bao gồm:

  • Phát hiện gian lận và rủi ro
  • Quảng cáo được nhắm mục tiêu
  • Nhận dạng giọng nói
  • Chăm sóc sức khỏe
  • Đề xuất trang web
  • Nhận dạng hình ảnh nâng cao
  • Tìm kiếm Internet
  • Lập kế hoạch tuyến đường hàng không
4. Data Mining là gì?

Thuật ngữ Data Mining xuất hiện vào năm 1990 trong cộng đồng cơ sở dữ liệu. Data Mining (khai thác dữ liệu) được các công ty bán lẻ và cộng đồng tài chính sử dụng cho mục đích phân tích dữ liệu và xác định xu hướng để tăng cơ sở khách hàng, đồng thời dự đoán những biến động về giá cổ phiếu, lãi suất và nhu cầu của khách hàng.

Data Mining là quá trình xác định các mẫu trong bộ dữ liệu lớn. Nó liên quan đến các phương pháp giao nhau của hệ thống cơ sở dữ liệu, thống kê và học máy. Mục tiêu chung của lĩnh vực thống kê và khoa học máy tính liên ngành này là trích xuất thông tin từ các bộ dữ liệu hoặc thư viện dữ liệu lớn bằng cách sử dụng các thuật toán toán học phức tạp và biến chúng thành một cấu trúc dễ hiểu để sử dụng thêm.

Data Mining giúp thu thập thông tin chi tiết thông qua việc trích xuất, xem xét và xử lý dữ liệu thô một cách cẩn thận để khám phá các mẫu và mối tương quan có thể có giá trị cho doanh nghiệp. Quy trình khai thác dữ liệu bao gồm các loại dịch vụ khác nhau như:

  • Web mining
  • Text mining
  • Audio mining
  • Video mining
  • Social network data mining
  • Pictorial data mining

Data Mining còn được gọi là khám phá tri thức trong dữ liệu (KDD), được thực hiện với sự trợ giúp của phần mềm đơn giản hoặc nâng cao. Các bước sau liên quan đến khai thác dữ liệu:

  • Hiểu biết kinh doanh: Nó liên quan đến việc giới thiệu và hiểu mục tiêu và công việc của doanh nghiệp cũng như hiểu các yếu tố quan trọng sẽ giúp đạt được mục tiêu của doanh nghiệp.
  • Hiểu dữ liệu: Nó thực hiện thu thập dữ liệu và tích lũy dữ liệu. Dữ liệu được liệt kê dựa trên dữ liệu nguồn, vị trí của nó, cách nó đạt được và nếu có bất kỳ vấn đề nào đã xảy ra. Dữ liệu sau đó được trực quan hóa và kiểm tra tính đầy đủ của nó.
  • Chuẩn bị dữ liệu: Nó liên quan đến việc lựa chọn dữ liệu hữu ích, làm sạch nó, xây dựng các thuộc tính từ nó và tích hợp dữ liệu từ nhiều cơ sở dữ liệu.
  • Lập mô hình: Nó liên quan đến việc lựa chọn các kỹ thuật khai thác dữ liệu, tạo thiết kế thử nghiệm để đánh giá mô hình đã chọn, xây dựng mô hình từ bộ dữ liệu và đánh giá mô hình với các chuyên gia để biết kết quả.
  • Đánh giá: Nó xác định mức độ mà mô hình kết quả đáp ứng các yêu cầu kinh doanh bằng cách thử nghiệm nó dựa trên các ứng dụng thực tế.
  • Triển khai: Nó tạo ra một kế hoạch triển khai và hình thành một chiến lược để kiểm tra tính hữu ích của mô hình khai thác dữ liệu thông qua bảo trì và giám sát.
5. Các ứng dụng của Data Mining

Một số ứng dụng của khai thác dữ liệu là:

  • Phân tích thị trường
  • Phân tích tài chính
  • Giáo dục đại học
  • Phát hiện gian lận
6. So sánh Data Mining và Data Science
  • Sự khác biệt lớn nhất giữa Data Science và Data Mining nằm ở các thuật ngữ của chúng. Mặc dù, Data Science là một lĩnh vực rộng lớn liên quan đến việc thu thập dữ liệu, phân tích dữ liệu và thu thập thông tin chi tiết có thể hành động từ nó, nhưng Data Mining chủ yếu liên quan đến việc tìm kiếm thông tin hữu ích trong tập dữ liệu và sử dụng thông tin đó để xác định các mẫu ẩn.
  • Một sự khác biệt lớn khác giữa Data Science và Data Mining là lĩnh vực này trước đây là một lĩnh vực đa ngành bao gồm thống kê, trực quan hóa dữ liệu, khoa học xã hội, xử lý ngôn ngữ tự nhiên (NLP) và khai thác dữ liệu, có nghĩa là Data Mining là một tập hợp con của Data Science.
  • Ở một mức độ nào đó, một nhà khoa học dữ liệu có thể được coi là sự kết hợp của một nhà nghiên cứu trí tuệ nhân tạo (AI), kỹ sư học máy, kỹ sư học sâu và nhà phân tích dữ liệu. Mặt khác, một chuyên gia khai thác dữ liệu không nhất thiết phải thực hiện tất cả các vai trò này mà có thể được thực hiện bởi một nhà khoa học dữ liệu.
  • Một sự khác biệt đáng chú ý khác nằm ở loại dữ liệu được sử dụng. Data Science chủ yếu giải quyết tất cả các loại dữ liệu như có cấu trúc, phi cấu trúc và bán cấu trúc. Tuy nhiên, Data Mining chủ yếu xử lý dữ liệu có cấu trúc.
  • Khi xem xét bản chất công việc, có một sự khác biệt khác giữa Data Science và Data Mining. Khám phá các mẫu và phân tích chúng là một thành phần chính của khai thác dữ liệu. Data Science cũng liên quan đến vấn đề tương tự nhưng nó cũng liên quan đến việc dự báo các sự kiện trong tương lai bằng cách tận dụng dữ liệu hiện tại và lịch sử bằng cách sử dụng các công cụ và công nghệ khác nhau.
  • Data Science tập trung vào khoa học dữ liệu, trong khi Data Mining chủ yếu liên quan đến quá trình phát hiện sự bất thường và không nhất quán và dự đoán kết quả.

Bảng tóm tắt dưới đây sẽ giúp các bạn dễ hình dung hơn:

  Data Science Data Mining
1

Data Science là một lĩnh vực nghiên cứu.

Data Mining là một kỹ thuật là một phần của quy trình KDD.
2

Nó là về thu thập, xử lý, phân tích và sử dụng dữ liệu trong các hoạt động khác nhau.

Đó là về việc trích xuất thông tin có giá trị từ dữ liệu.

3

Đó là về việc trích xuất thông tin có giá trị từ dữ liệu.

Mục tiêu của nó là nhận ra giá trị của dữ liệu và làm cho nó có thể sử dụng được bằng cách trích xuất thông tin quan trọng.
4

Nó xử lý tất cả các loại dữ liệu bao gồm có cấu trúc, không có cấu trúc hoặc bán cấu trúc.

Nó chủ yếu xử lý dữ liệu có cấu trúc.
5

Nó liên quan đến việc quét dữ liệu, làm sạch, trực quan hóa, thống kê, …. Do đó, nó là một tập hợp siêu khai thác dữ liệu.

Nó là một tập hợp con của khoa học dữ liệu vì các hoạt động khai thác nằm trong đường ống của khoa học dữ liệu.
6

Về cơ bản, nó được thực hiện cho các mục đích khoa học.

Nó chủ yếu được sử dụng cho mục đích kinh doanh.
7

Nó tập trung vào khoa học dữ liệu.

Nó tham gia nhiều hơn vào các quy trình của nó.

Hy vọng với những chia sẻ trên đây các bạn đã có thể phân biệt hai thuật ngữ Data Science và Data Mining. Các nội dung mới cùng những kiến thức thú vị sẽ được cập nhật thường xuyên, đừng quên đón đọc tại BAC's Blog.

Nguồn tham khảo:
https://intellipaat.com/

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.
 
 

CÁC KHOÁ HỌC BUSINESS ANALYST BACs.VN DÀNH CHO BẠN

Khoá học Online:

  • Chìa khoá thành công dành cho Business Analyst

  • Công cụ & Kỹ năng dành cho Business Analyst

Khoá học Offline:

Tại Tp.HCM:

  • Phân tích nghiệp vụ cơ bản 3.0

  • Phân tích nghiệp vụ nâng cao 3.0

  • Luyện thi chứng chỉ IIBA 3.0

Tại Hà Nội:

  • Hà Nội - Phân tích nghiệp vụ 3.0

  • Hà Nội - Phân tích nghiệp vụ nâng cao 3.0

Tham khảo lịch khai giảng TẤT CẢ các khóa học mới nhất

Ban biên tập nội dung - BAC

 

Click để đọc tiếp

  • Các Business Analyst cần trau dồi những công nghệ gì trong năm 2025
    Các Business Analyst cần trau dồi những công nghệ gì trong năm 2025

    Đối với sự phát triển nhanh chóng của công nghệ ngày này, việc không ngừng trau dồi và học hỏi là điều bắt buộc mà các Business Analyst phải làm để phát triển hơn trong lĩnh vực phân tích nghiệp vụ. Trong bài viết này, các bạn hãy cùng BAC tìm hiểu các xu hướng và các kỹ năng mới để làm hành trang trên sự nghiệp Business Analyst nhé!

  • Sự khác biệt giữa UAT và Usability Testing Business Analyst cần lưu ý
    Sự khác biệt giữa UAT và Usability Testing Business Analyst cần lưu ý

    UAT và Usability Testing thường được mang lên bàn cân để so sánh nhưng, đây là 2 phương pháp kiểm thử khác nhau. Trong khi Usability Testing đảm bảo sự hài lòng của người dùng thì UAT lại giúp các Business Analyst xác thực chức năng. Cả hai đều là một phần không thể thiếu để cung cấp một sản phẩm chất lượng cao. Hãy cùng BAC tìm hiểu ngay nhé!

  • API là gì? Khám phá cầu nối giữa các ứng dụng
    API là gì? Khám phá cầu nối giữa các ứng dụng

    API là nền tảng quan trọng kết nối các ứng dụng và dịch vụ trong kỷ nguyên số, tạo ra sự linh hoạt, hiệu quả và mở rộng cho các hệ thống. Bài viết sau giới thiệu API, cách hoạt động, các kiểu kiến trúc phổ biến cùng các công cụ kiểm thử API như Postman.

  • Meta AI là gì và cách sử dụng Meta AI hiệu quả 2025
    Meta AI là gì và cách sử dụng Meta AI hiệu quả 2025

    Meta AI là một công cụ Trí Tuệ Nhân Tạo do chính công ty mẹ của Facebook, Instagram, WhatsApp ra mắt. Đây được xem là một cuộc cách mạng sẽ làm thay đổi cách mà các doanh nghiệp và người dùng sử dụng mạng xã hội.

Bình luận

CÔNG TY CỔ PHẦN ĐÀO TẠO VÀ TƯ VẤN BAC

Mã số doanh nghiệp: 0312713743 do Sở Kế hoạch & Đầu tư TP.HCM cấp ngày 28/03/2014
Trụ sở chính: Lầu 6 - Tòa nhà Thiên Phước 1, 244 Cống Quỳnh, Phường Phạm Ngũ Lão, Quận 1, TP. HCM.
Chi nhánh: Lầu 11, Tòa nhà Hải Âu, Số 39B Trường Sơn, Quận Tân Bình, Tp.HCM.
Email: info@bacs.vn - Web: www.bacs.vn - Điện thoại: (84) 909 310 768

Đã thông báo bộ công thương
DMCA.com Protection Status

Copyright © 2014 BAC JSC.
All Rights Reserved.

BAC - Business Analyst Training Center