• Kiến thức
  • Kỹ năng
  • Nghề nghiệp
  • Công cụ hỗ trợ
  • Luật doanh nghiệp

Video

Business Analysis

Đăng ký nhận tin

 

Ý kiến học viên

  • Nguyễn Thị Mai Bình

    Business Analyst
    Với một người ngoại đạo như mình thì những chuyên đề về "kỹ thuật" của BA hết sức quan trọng. Ví dụ như sử dụng các diagram để mô hình hóa requirement, viết User Story/Use case, v...v..
     
    Đến với khóa học Fundamental Business Analysis, mình đã được gặp thầy Lộc, một người người rất nhiệt tình và có tâm. Ngoài việc chia sẻ các kinh nghiệm thực tế trên lớp thì thầy còn dành thời gian ra để tư vấn, hỗ trợ, góp ý CV cho mình. Bên cạnh đó trung tâm và anh Phụng cũng hỗ trợ gửi CV, kết nối học viên tới mạng lưới các công ty đối tác chất lượng, điều này giúp học viên như mình tìm được công việc phù hợp nhất. Cảm ơn BAC.
    Xem chi tiết +
  • Phạm Quế

    Business Analyst

    Khoá học Product Design của BAC đã cung cấp cho tôi nhiều kiến thức và nền tảng vô cùng hữu ích. Giảng viên giảng dạy rất nhiệt tình, truyền cho chúng tôi ngọn lửa đam mê và nhiệt huyết trong ngành. Đồng thời chia sẻ các kiến thức và kỹ năng cần thiết trong bài giảng một cách dễ hiểu hơn. Số lượng học viên không quá nhiều nên chất lượng giảng giạy vô cùng tốt. Giảng viên sửa bài tập 1-1 nên bài giảng sẽ chuyên sâu hơn.

    Xem chi tiết +
  • Nguyễn Văn Long

    Chuyên viên về chế độ kế toán & Giải pháp nghiệp vụ Tài chính kế toán trong ứng dụng CNTT - Tập đoàn Điện lực Việt Nam (EVN)

    Tôi đã tham gia khóa Phân tích nghiệp vụ phần mềm cơ bản 3.0 tại BAC. Ở đây, tài liệu đào tạo cung cấp nhiều nội dung bổ ích và trình bày dễ hiểu. Giảng viên rất nhiệt tình, ngoài nội dung giảng dạy theo giáo trình còn chia sẻ nhiều kinh nghiệm thực tiễn, các câu hỏi của học viên đều được giải đáp ngay trên lớp và có minh họa từ các dự án trong thực tế. Sau tất cả, tôi cảm ơn BAC và Thầy giáo Thái Sơn.

    Xem chi tiết +
BAC TRAINING & CONSULTANCY VN BAC TRAINING & CONSULTANCY VN BAC TRAINING & CONSULTANCY VN
Language  
Điện thoại tư vấn0909 310 768
Facebook Youtube Linkedin

Jun 26, 2022

Data Science là gì? Tất cả những gì bạn cần biết (Phần 1)

Nền tảng của Data Science là cách có thể rút ra thông tin chi tiết bằng cách sử dụng dữ liệu thô và phi cấu trúc. Các tổ chức xử lý zettabyte và yottabyte dữ liệu có cấu trúc và phi cấu trúc mỗi ngày. Bài viết này nhằm cung cấp nội dung chuyên sâu để giúp bạn nắm bắt chi tiết các khái niệm về Data Science hay khoa học dữ liệu và hiểu chúng một cách thấu đáo.

Data Science là từ khóa có lượng tìm kiếm tăng nhanh vài năm qua

1. Data Science là gì?

Data Science là một lĩnh vực liên ngành của Khoa học máy tính (Computer Science) liên quan đến việc tạo ra các thuật toán và mô hình để trích xuất, xử lý, trực quan hóa và tìm ra các mẫu ẩn từ thông tin thô. Data Extraction (Trích xuất dữ liệu) và Data Transformation (chuyển đổi dữ liệu), Statistical Analysis (Phân tích thống kê), Data Manipulation (Thao tác dữ liệu), Data Visualization (Trực quan hóa dữ liệu), Machine Learning (Học máy) và Predictive Modeling (Lập mô hình dự đoán) là một số lĩnh vực phổ biến nhất trong khoa học máy tính sử dụng các kỹ thuật khoa học dữ liệu.

Các nhà khoa học dữ liệu đến từ nhiều chuyên môn và nền tảng giáo dục khác nhau, đồng thời họ phải mạnh trong các lĩnh vực sau:

  • Kiến thức miền: Mục đích chính của nhà khoa học dữ liệu là nhận được thông tin hữu ích, mang lại lợi ích cho hoạt động kinh doanh của tổ chức, ngoài dữ liệu thô. Là một nhà khoa học dữ liệu, bạn nên biết về mô hình kinh doanh của công ty và đặt những câu hỏi phù hợp để tạo ra kết quả có giá trị.
  • Kỹ năng toán học: Đại số tuyến tính, giải tích và các khái niệm toán học khác giúp hiểu hành vi phức tạp của các thuật toán Máy học và khám phá các mẫu ẩn. Trong phân tích dữ liệu, xác suất và thống kê chủ yếu được sử dụng để tạo mô hình dự đoán và phân cụm. Do đó, một nhà khoa học dữ liệu nên có kiến ​​thức tốt về các khái niệm toán học.
  • Khoa học máy tính: Không thể triển khai các kỹ thuật khoa học dữ liệu nếu không biết các ngôn ngữ lập trình như Python, R, SQL, Scala, Julia, JavaScript, v.v. Một nhà khoa học dữ liệu xử lý các cơ sở dữ liệu đa dạng và mạng lớn trong khi xử lý dữ liệu. Vì vậy, một nhà khoa học dữ liệu nên hiểu rõ về các ngôn ngữ lập trình, cấu trúc và thuật toán cơ bản, cơ sở dữ liệu quan hệ và phi quan hệ, máy tính phân tán và học máy.
  • Kỹ năng giao tiếp: Trong khi làm dự án, cần giao tiếp tốt với các thành viên khác trong nhóm. Một nhà khoa học dữ liệu phải đưa ra kết luận từ việc phân tích dữ liệu và trình bày chúng trước nhóm, sếp hoặc các bên liên quan của họ.
2. Các thành phần của Data Science
  • Dữ liệu (và các loại khác nhau của nó)

Tập dữ liệu thô là nền tảng của Data Science. Dữ liệu chủ yếu được chia thành hai loại là dữ liệu có cấu trúc, chủ yếu ở dạng bảng và dữ liệu phi cấu trúc, bao gồm hình ảnh, video, email, tệp PDF,...

  • Lập trình (Python và R)

Quản lý và phân tích dữ liệu được thực hiện bằng lập trình máy tính. Python và R là hai ngôn ngữ lập trình phổ biến nhất.

  • Thống kê và xác suất

Dữ liệu được thao tác để trích xuất thông tin ra khỏi nó. Nền tảng toán học của Data Science là thống kê và xác suất. Nếu không có kiến ​​thức rõ ràng về thống kê và xác suất, có khả năng cao sẽ hiểu sai dữ liệu và đưa ra kết luận không chính xác.

  • Học máy (Machine learning)

Một nhà khoa học dữ liệu sử dụng các Thuật toán Máy học, chẳng hạn như các phương pháp hồi quy và phân loại, hàng ngày. Điều rất quan trọng là các nhà khoa học dữ liệu phải biết học máy là một phần công việc của họ để họ có thể có được những hiểu biết có giá trị từ dữ liệu có sẵn.

  • Dữ liệu lớn (Big Data)

Trong thế giới hiện tại, dữ liệu thô được so sánh với dầu thô. Cách dầu tinh luyện được chiết xuất từ ​​dầu thô, thông tin có giá trị tương tự có thể được chiết xuất từ ​​dữ liệu thô bằng cách áp dụng khoa học dữ liệu. Các công cụ khác nhau được các nhà khoa học dữ liệu sử dụng để xử lý dữ liệu lớn là Java, Hadoop, R, Pig, Apache Spark,....

  • Công cụ phát triển

Các công cụ phát triển, chẳng hạn như MongoDB, Apache Spark, Apache Kafka, pandas, ggplot2, Scikit-learning,..., được sử dụng để phát triển và nâng cao các chức năng của khoa học dữ liệu như lưu trữ dữ liệu, chuyển đổi dữ liệu, mô hình hóa dữ liệu và trực quan hóa dữ liệu.

3. Những ví dụ về Data Science

Ngày nay, các ví dụ và ứng dụng của khoa học dữ liệu đã phổ biến trong nhiều ngành công nghiệp. Vì những lý do rõ ràng, một số ví dụ quan trọng nhất hiện nay là việc sử dụng khoa học dữ liệu để nghiên cứu coronavirus.

Một số ví dụ về khoa học dữ liệu bao gồm phát hiện gian lận, khuyến nghị chăm sóc sức khỏe, phát hiện tin tức giả, tự động hóa trong hệ thống khuyến nghị chăm sóc khách hàng, thương mại điện tử và giải trí,....

4. Điều kiện tiên quyết cho Data Science

Có những điều kiện tiên quyết mà bạn cần biết trước khi có thể bắt đầu học Data Science.

  • Học máy (Machine Learning)

Học máy là một phần quan trọng của khoa học dữ liệu. Nó giúp phân tích lượng dữ liệu khổng lồ bằng cách sử dụng các thuật toán khác nhau. Là một nhà khoa học dữ liệu, bạn cần phải thành thạo về Học máy.

  • Mô hình hóa (Modeling)

Các nhà khoa học dữ liệu cần phải giỏi mô hình hóa, một quá trình bao gồm việc tìm ra một thuật toán phù hợp để giải quyết vấn đề và đào tạo các mô hình. Mô hình hóa cũng là một phần của Học máy.

  • Số liệu thống kê (Statistic)

Thống kê là một phần quan trọng của Data Science. Nó giúp nhập dữ liệu, đánh giá mô hình, trực quan hóa dữ liệu,.... Các nhà khoa học dữ liệu có thể tạo ra những hiểu biết sâu sắc hơn từ dữ liệu với sự trợ giúp của Thống kê.

  • Lập trình (Programming)

Python và R thường được sử dụng trong việc thực hiện các dự án khoa học dữ liệu. Điều quan trọng là phải biết ngôn ngữ lập trình.

  • Cơ sở dữ liệu (Databases)

Các nhà khoa học dữ liệu xử lý rất nhiều dữ liệu nên điều quan trọng là họ phải biết cách làm việc với cơ sở dữ liệu.

5. Vòng đời của Data Science

Để hiểu rõ hơn “khoa học dữ liệu là gì?” hãy xem ví dụ sau. Giả sử, ông X là chủ một cửa hàng bán lẻ và mục tiêu của ông là cải thiện doanh thu của cửa hàng bằng cách xác định các yếu tố thúc đẩy doanh số bán hàng chính. Để hoàn thành mục tiêu của mình, anh X cần trả lời các câu hỏi sau:

Những sản phẩm nào có lợi nhất trong cửa hàng?

Các chương trình khuyến mãi tại cửa hàng hoạt động như thế nào?

Các vị trí sản phẩm có được triển khai hiệu quả không?

Câu trả lời cho những câu hỏi này chắc chắn sẽ ảnh hưởng đến kết quả của dự án. Do đó, anh ấy chỉ định bạn làm nhà khoa học dữ liệu, đây là cách giải quyết vấn đề này bằng vòng đời của khoa học dữ liệu.

  • Khám phá dữ liệu

Giai đoạn đầu tiên trong vòng đời của khoa học dữ liệu cho bất kỳ vấn đề nào là khám phá dữ liệu. Nó bao gồm các cách để khám phá dữ liệu từ nhiều nguồn khác nhau, có thể ở định dạng phi cấu trúc, như video hoặc hình ảnh và định dạng có cấu trúc, như tệp văn bản hoặc hệ thống cơ sở dữ liệu quan hệ. Các tổ chức cũng đang xem xét dữ liệu truyền thông xã hội của khách hàng để hiểu rõ hơn về suy nghĩ của khách hàng.

Ở giai đoạn này, với tư cách là một nhà khoa học dữ liệu, mục tiêu của bạn là tăng doanh thu của cửa hàng bán lẻ của Mr. X. Một số yếu tố ảnh hưởng đến doanh số có thể là:

Vị trí cửa hàng

Nhân Viên

Giờ làm việc

Khuyến mại

Vị trí sản phẩm

Định giá sản phẩm

Vị trí và chương trình khuyến mãi của đối thủ cạnh tranh

Lưu ý các yếu tố này, bạn sẽ phát triển rõ ràng về dữ liệu và thu thập tất cả dữ liệu liên quan đến các yếu tố được liệt kê ở trên.

  • Chuẩn bị dữ liệu

Khi giai đoạn khám phá dữ liệu hoàn thành, giai đoạn tiếp theo là chuẩn bị dữ liệu. Nó bao gồm việc chuyển đổi các dữ liệu khác nhau thành một định dạng chung để làm việc với nó một cách liền mạch. Quá trình này liên quan đến việc thu thập các tập hợp con dữ liệu sạch và chèn các giá trị mặc định phù hợp; nó cũng có thể liên quan đến các phương pháp phức tạp hơn như xác định các giá trị còn thiếu bằng cách lập mô hình,....

Sau khi làm sạch dữ liệu, bước tiếp theo là tích hợp và tạo kết luận từ tập dữ liệu để phân tích. Điều này liên quan đến việc tích hợp dữ liệu, bao gồm việc hợp nhất hai hoặc nhiều bảng của cùng một đối tượng nhưng lưu trữ thông tin khác nhau hoặc tóm tắt các trường trong một bảng bằng cách sử dụng tính năng tổng hợp. Tại đây, bạn cũng sẽ cố gắng khám phá và hiểu các mẫu và giá trị của tập dữ liệu.

  • Mô hình toán học

Bạn có biết rằng tất cả các dự án khoa học dữ liệu đều có một số mô hình toán học nhất định thúc đẩy chúng. Các mô hình này được lập kế hoạch và xây dựng bởi các nhà khoa học dữ liệu để phù hợp với các nhu cầu cụ thể của tổ chức. Điều này có thể liên quan đến các khái niệm toán học khác nhau bao gồm thống kê, hồi quy logistic và tuyến tính, phép tính vi phân và tích phân,..., các công cụ trực quan như Tableau và QlikView.

Một mô hình có thể không đủ để tạo ra một kết quả hài lòng. Bạn có thể cần sử dụng hai hoặc nhiều mô hình. Trong trường hợp này, bạn, với tư cách là một nhà khoa học dữ liệu, sẽ tạo ra một nhóm các mô hình. Sau khi đo các mô hình, bạn sẽ sửa lại các thông số và tinh chỉnh chúng cho lần chạy mô hình tiếp theo. Quá trình này sẽ tiếp tục cho đến khi bạn chắc chắn rằng họ đã tìm thấy mô hình tốt nhất.

Ở giai đoạn này, bạn sẽ xây dựng các mô hình toán học dựa trên nhu cầu kinh doanh của ông X, dựa trên việc Sản phẩm A hay Sản phẩm B có lợi nhuận cao hơn hay không, các vị trí đặt sản phẩm có hoạt động hiệu quả hay không,...

  • Bắt đầu hành động

Khi dữ liệu được chuẩn bị và các mô hình được xây dựng, đã đến lúc các mô hình này hoạt động để đạt được kết quả mong muốn. Có thể có sự khác biệt khác nhau dẫn đến rất nhiều cách xử lý sự cố; do đó, mô hình có thể phải được điều chỉnh. Ở đây, đánh giá mô hình giải thích hiệu suất của mô hình.

Ở giai đoạn này, bạn sẽ thu thập thông tin và thu được kết quả dựa trên các yêu cầu kinh doanh của ông X.

  • Liên lạc

Truyền đạt những phát hiện là bước cuối cùng nhưng không kém phần quan trọng nhất trong nỗ lực khoa học dữ liệu. Ở giai đoạn này, bạn cần phải là người liên lạc giữa các nhóm khác nhau và bạn phải có thể truyền đạt thông tin một cách liền mạch cho các bên liên quan chính và những người ra quyết định trong tổ chức để có thể đưa ra các quyết định và các hành động có thể được thực hiện dựa trên các khuyến nghị của bạn.

Trong ví dụ, dựa trên kết quả nghiên cứu, bạn sẽ giao tiếp và đề xuất những thay đổi nhất định trong chiến lược kinh doanh để ông X có thể thu được lợi nhuận tối đa.

Qua phần đầu tiên chúng ta đã tìm hiểu về khái niệm Data Science. Trong phần sau, BAC sẽ tiếp tục gửi đến bạn đọc các thông tin về Data Scientist, công việc có mức thu nhập hấp dẫn và nhu cầu tăng cao tại nhiều quốc gia trên thế giới, bao gồm Việt Nam.

Tham khảo: Data Science là gì? Tất cả những gì bạn cần biết (Phần 2)

Nguồn tham khảo:
https://intellipaat.com/

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.
 
 

CÁC KHOÁ HỌC BUSINESS ANALYST BACs.VN DÀNH CHO BẠN

Khoá học Online:

  • Chìa khoá thành công dành cho Business Analyst

  • Công cụ & Kỹ năng dành cho Business Analyst

Khoá học Offline:

Tại Tp.HCM:

  • Phân tích nghiệp vụ cơ bản 3.0

  • Phân tích nghiệp vụ nâng cao 3.0

  • Luyện thi chứng chỉ IIBA 3.0

Tại Hà Nội:

  • Hà Nội - Phân tích nghiệp vụ 3.0

  • Hà Nội - Phân tích nghiệp vụ nâng cao 3.0

Tham khảo lịch khai giảng TẤT CẢ các khóa học mới nhất

Ban biên tập nội dung - BAC

 

Click để đọc tiếp

  • Các Business Analyst cần trau dồi những công nghệ gì trong năm 2025
    Các Business Analyst cần trau dồi những công nghệ gì trong năm 2025

    Đối với sự phát triển nhanh chóng của công nghệ ngày này, việc không ngừng trau dồi và học hỏi là điều bắt buộc mà các Business Analyst phải làm để phát triển hơn trong lĩnh vực phân tích nghiệp vụ. Trong bài viết này, các bạn hãy cùng BAC tìm hiểu các xu hướng và các kỹ năng mới để làm hành trang trên sự nghiệp Business Analyst nhé!

  • Sự khác biệt giữa UAT và Usability Testing Business Analyst cần lưu ý
    Sự khác biệt giữa UAT và Usability Testing Business Analyst cần lưu ý

    UAT và Usability Testing thường được mang lên bàn cân để so sánh nhưng, đây là 2 phương pháp kiểm thử khác nhau. Trong khi Usability Testing đảm bảo sự hài lòng của người dùng thì UAT lại giúp các Business Analyst xác thực chức năng. Cả hai đều là một phần không thể thiếu để cung cấp một sản phẩm chất lượng cao. Hãy cùng BAC tìm hiểu ngay nhé!

  • API là gì? Khám phá cầu nối giữa các ứng dụng
    API là gì? Khám phá cầu nối giữa các ứng dụng

    API là nền tảng quan trọng kết nối các ứng dụng và dịch vụ trong kỷ nguyên số, tạo ra sự linh hoạt, hiệu quả và mở rộng cho các hệ thống. Bài viết sau giới thiệu API, cách hoạt động, các kiểu kiến trúc phổ biến cùng các công cụ kiểm thử API như Postman.

  • Meta AI là gì và cách sử dụng Meta AI hiệu quả 2025
    Meta AI là gì và cách sử dụng Meta AI hiệu quả 2025

    Meta AI là một công cụ Trí Tuệ Nhân Tạo do chính công ty mẹ của Facebook, Instagram, WhatsApp ra mắt. Đây được xem là một cuộc cách mạng sẽ làm thay đổi cách mà các doanh nghiệp và người dùng sử dụng mạng xã hội.

Bình luận

CÔNG TY CỔ PHẦN ĐÀO TẠO VÀ TƯ VẤN BAC

Mã số doanh nghiệp: 0312713743 do Sở Kế hoạch & Đầu tư TP.HCM cấp ngày 28/03/2014
Trụ sở chính: Lầu 6 - Tòa nhà Thiên Phước 1, 244 Cống Quỳnh, Phường Phạm Ngũ Lão, Quận 1, TP. HCM.
Chi nhánh: Lầu 11, Tòa nhà Hải Âu, Số 39B Trường Sơn, Quận Tân Bình, Tp.HCM.
Email: info@bacs.vn - Web: www.bacs.vn - Điện thoại: (84) 909 310 768

Đã thông báo bộ công thương
DMCA.com Protection Status

Copyright © 2014 BAC JSC.
All Rights Reserved.

BAC - Business Analyst Training Center