• Kiến thức
  • Kỹ năng
  • Nghề nghiệp
  • Công cụ hỗ trợ
  • Luật doanh nghiệp

Video

Business Analysis

Đăng ký nhận tin

 

Ý kiến học viên

  • Nguyễn Thị Mai Bình

    Business Analyst
    Với một người ngoại đạo như mình thì những chuyên đề về "kỹ thuật" của BA hết sức quan trọng. Ví dụ như sử dụng các diagram để mô hình hóa requirement, viết User Story/Use case, v...v..
     
    Đến với khóa học Fundamental Business Analysis, mình đã được gặp thầy Lộc, một người người rất nhiệt tình và có tâm. Ngoài việc chia sẻ các kinh nghiệm thực tế trên lớp thì thầy còn dành thời gian ra để tư vấn, hỗ trợ, góp ý CV cho mình. Bên cạnh đó trung tâm và anh Phụng cũng hỗ trợ gửi CV, kết nối học viên tới mạng lưới các công ty đối tác chất lượng, điều này giúp học viên như mình tìm được công việc phù hợp nhất. Cảm ơn BAC.
    Xem chi tiết +
  • Phạm Quế

    Business Analyst

    Khoá học Product Design của BAC đã cung cấp cho tôi nhiều kiến thức và nền tảng vô cùng hữu ích. Giảng viên giảng dạy rất nhiệt tình, truyền cho chúng tôi ngọn lửa đam mê và nhiệt huyết trong ngành. Đồng thời chia sẻ các kiến thức và kỹ năng cần thiết trong bài giảng một cách dễ hiểu hơn. Số lượng học viên không quá nhiều nên chất lượng giảng giạy vô cùng tốt. Giảng viên sửa bài tập 1-1 nên bài giảng sẽ chuyên sâu hơn.

    Xem chi tiết +
  • Nguyễn Văn Long

    Chuyên viên về chế độ kế toán & Giải pháp nghiệp vụ Tài chính kế toán trong ứng dụng CNTT - Tập đoàn Điện lực Việt Nam (EVN)

    Tôi đã tham gia khóa Phân tích nghiệp vụ phần mềm cơ bản 3.0 tại BAC. Ở đây, tài liệu đào tạo cung cấp nhiều nội dung bổ ích và trình bày dễ hiểu. Giảng viên rất nhiệt tình, ngoài nội dung giảng dạy theo giáo trình còn chia sẻ nhiều kinh nghiệm thực tiễn, các câu hỏi của học viên đều được giải đáp ngay trên lớp và có minh họa từ các dự án trong thực tế. Sau tất cả, tôi cảm ơn BAC và Thầy giáo Thái Sơn.

    Xem chi tiết +
BAC TRAINING & CONSULTANCY VN BAC TRAINING & CONSULTANCY VN BAC TRAINING & CONSULTANCY VN
Language  
Điện thoại tư vấn0909 310 768
Facebook Youtube Linkedin

Apr 18, 2022

Dữ liệu cấu trúc và Dữ liệu phi cấu trúc (Phần 1)

Bạn có biết, hơn 80% dữ liệu doanh nghiệp hiện nay là Dữ liệu phi cấu trúc?
Không chỉ chiếm phần lớn dữ liệu doanh nghiệp, mà Dữ liệu phi cấu trúc cũng đang tăng với tốc độ trung bình 55% - 65% mỗi năm. 
Vậy sự khác nhau giữa dữ liệu có cấu trúc và dữ liệu phi cấu trúc là gì?
Tại sao Dữ liệu phi cấu trúc có vai trò vô cùng quan trọng đối với các doanh nghiệp?
1. Dữ liệu cấu trúc (Structured Data)

Dữ liệu có cấu trúc nằm trong cơ sở dữ liệu quan hệ (relational databases): một cơ sở dữ liệu có cấu trúc để nhận ra mối quan hệ giữa các mục dữ liệu (item of data) được lưu trữ. Cơ sở dữ liệu loại này thường được quản lý thông qua hệ thống quản lý cơ sở dữ liệu quan hệ (Relational database management system, viết tắt là RDBMS).

Đây thường là những gì mọi người nghĩ đến khi họ nghĩ về một cơ sở dữ liệu, tức là một bảng các hàng và cột chứa thông tin liên quan. Ví dụ:

ID Tên khóa học Mô tả Học phí
1

Khóa học Python

Khóa học này bao gồm những kiến thức và kỹ năng thực tế từ cơ bản đến nâng cao và những kỹ năng cần thiết về cách phát triển website dựa trên Django Framework

5700000
2

Khóa học C++

Khóa học này giúp bạn nắm được các kiến thức căn bản nhất về lập trình với ngôn ngữ C/C++

5700000
3

Khóa học C#

Khóa học giúp bạn nắm vững các kỹ năng, kiến thức chuyên môn cần phải có đối với 1 lập trình viên phát triển các dự án phần mềm với C#.NET

5700000

RDBMS sử dụng ngôn ngữ truy vấn có cấu trúc (SQL) để truy cập và thao tác với các mục dữ liệu trong RDBMS. Chúng được mô tả như sau:

SQL RDBMS Mô tả
Row

Record

Tập dữ liệu đại diện cho một item, ví dụ: dữ liệu của “Khóa học Python” được mô tả ở trên

Column

Attribute/Field

Một phần tử cụ thể và được gắn nhãn của một cột, ví dụ: “Học phí”

Table

Relation

Một tập hợp các hàng và cột chia sẻ các thuộc tính giống nhau, tức là sắp xếp các thông tin giống nhau về một tập hợp các đối tượng dữ liệu

Dữ liệu có cấu trúc là thông tin, thường là các tệp văn bản được gắn nhãn để mô tả các thuộc tính (attribute) và mối quan hệ của nó với các dữ liệu khác. Cấu trúc dữ liệu này có thể dễ dàng tìm kiếm bằng cách sử dụng truy vấn do con người tạo ra hoặc theo thuật toán.

2. Dữ liệu phi cấu trúc
Dữ liệu phi cấu trúc:
  • Có cấu trúc bên trong (tức là các bit và byte)
  • Nhưng không được cấu trúc thông qua các mô hình hoặc lược đồ dữ liệu được xác định trước, tức là không được tổ chức và gắn nhãn để xác định các mối quan hệ có ý nghĩa giữa các dữ liệu.
Nó có thể là văn bản hay phi văn bản. Nó có thể do con người hay máy móc tạo ra. Nó cũng có thể được lưu trữ trong một cơ sở dữ liệu không quan hệ như NoSQL.
2.1. Dữ liệu phi cấu trúc do con người tạo ra (Human-generated unstructured data)
Dữ liệu phi cấu trúc điển hình do con người tạo ra bao gồm:
  • Text files (Tệp văn bản): Tệp xử lý văn bản, bảng tính, bản trình bày, email.
  • Email: Phần lớp là văn bản, nhưng có một số cấu trúc bên trong nhờ siêu dữ liệu của nó (ví dụ: bao gồm “to”, “from”, “date/time”, “subject” được nhập để gửi email) nhưng cũng kết hợp trong dữ liệu phi cấu trúc thông qua nội dung tin nhắn. Vì lý do này, email còn được gọi là dữ liệu bán cấu trúc (semi-structured data).
  • Social Media: Giống như email, đây cũng thường là dữ liệu bán cấu trúc, chứa dữ liệu phi cấu trúc (ví dụ: một bài đăng trên Facebook) nhưng cũng có dữ liệu có cấu trúc (ví dụ: số lượng “Like”, “Share”, “Comment”, v.v.)
  • Websites: YouTube, Instagram, v.v. chứa nhiều dữ liệu phi cấu trúc, nhưng cũng có nhiều dữ liệu có cấu trúc
  • Mobile data: Tin nhắn văn bản, vị trí.
  • Communications: Ims, bản ghi âm
  • Media: MP3, ảnh kỹ thuật số, bản ghi âm và tệp video
  • Business applications: Tài liệu MS Office, PDF và tương tự
2.2. Dữ liệu phi cấu trúc do máy tạo ra (Machine-generated unstructured data)
Các loại dữ liệu phi cấu trúc do máy tạo ra phổ biến bao gồm:
  • Satellite imagery (Hình ảnh vệ tinh): dữ liệu thời tiết, các dạng địa lí, các chuyển động của quân đội.
  • Scientific data (Dữ liệu khoa học): thăm dò dầu khí, thăm dò không gian, hình ảnh địa chấn và dữ liệu nguyên tử quyển.
  • Digital surveillance (Giám sát kỹ thuật số): CCTV
3. So sánh Dữ liệu cấu trúc và Dữ liệu phi cấu trúc


Structured Data vs. Unstructured Data

Dữ liệu có cấu trúc
Dữ liệu phi cấu trúc
Có thể được biểu diễn theo hàng, cột và cơ sở dữ liệu quan hệ

Không thể biểu diễn theo hàng, cột và cơ sở dữ liệu quan hệ

Ở dạng số, ngày tháng hoặc chuỗi
Ở dạng hình ảnh, âm thanh, video, file văn bản, email, trang tính
Chiếm khoảng 20% dữ liệu trong doanh nghiệp Chiếm khoảng 80% dữ liệu trong doanh nghiệp
Yêu cầu ít không gian lưu trữ Yêu cầu nhiều không gian lưu trữ
Dễ dàng quản lý và bảo vệ bằng các giải pháp kế thừa
Khó khăn hơn để quản lý và bảo vệ bằng các giải pháp kế thừa

4. Dữ liệu phi cấu trúc và tầm quan trọng đối với các doanh nghiệp

Theo John Roese, CTO của Dell Technologies: “Lần đầu tiên trong lịch sử, chúng ta không chỉ có một khối lượng lớn và đa dạng trong dữ liệu, mà con người còn sáng chế ra nhưng phương thức mới và mang tính kinh tế hơn trong việc lưu trữ và xử lý dữ liệu. Điều quan trọng nhất hiện nay, đó là phần mềm và những giải thuật đã đạt đến một ngưỡng – chủ yếu thông qua Trí tuệ nhân tạo (AI) và Học máy (ML) – mà chúng ta có thể đào sâu vào những dữ liệu mình có được và biến chúng thành những thông tin thú vị, bổ ích phục vụ cho kinh doanh và cuộc sống.”

Mô hình tháp thông tin DIKW (DIKW pyramid)

Tuy vậy, có một sự phân cấp rõ rệt trong dữ liệu. Đầu tiên là mức Dữ liệu (Data) – khi mọi thứ ở mức thô, chưa được quy hoạch và khai thác. Mức tiếp theo là Thông tin (Information) – khi dữ liệu được tổ chức dưới dạng các cấu trúc. Cao hơn nữa chúng ta có Kiến thức (Knowledge) – từ việc tìm thấy những sự thấu hiểu (insight) của những thông tin trước đó. Cuối cùng là Sự thông thái (Wisdom) – có được khi chúng ta biến những kiến thức thành những dự đoán cho tương lai, thành sự thấu hiểu quá khứ và thành những hành động thiết thực nhằm đạt được mục đích nào đó. Theo John Roese, hiện nay chúng ta đang tiến vào một kỷ nguyên mà hạ tầng CNTT, khối lượng dữ liệu cũng như những giải thuật phần mềm kết hợp lại với nhau và đem lại cho con người Kiến thức và Sự thông thái trong hầu hết tất cả các ngành nghề.

Có thể hình dung Data như tầng "phân bón" cho cây, qua các bước chuyển đổi chất, data sẽ chuyển thành thông tin (information), tiếp đến được khái quát thành kiến thức (knowledge) và tổng hợp thành tri thức thông thái (wisdom). Wisdom chính là trái ngọt của cây Mô hình tháp thông tin DIKW.

Unstructured data drives growth & innovation

Với việc chiếm 80% tổng dung lượng dữ liệu hiện nay, hiển nhiên là dữ liệu phi cấu trúc đang giữ trong mình những thông tin và “sự thấu hiểu” quan trọng trọng kinh doanh mà chưa được khai thác hết.

Dữ liệu có cấu trúc rất quan trọng, nhưng dữ liệu phi cấu trúc lại đóng vai trò then chốt trong việc tạo ra sự bứt phá cho doanh nghiệp nhờ việc đem lại sự phong phú về thông tin và kiến thức mà những kết quả thống kê thông thường qua dữ liệu có cấu trúc không thể đem lại. Chính vì vậy, các doanh nghiệp và tổ chức bắt buộc phải tìm ra phương pháp để quản lý và phân tích dữ liệu phi cấu trúc nhằm đưa ra các quyết định quan trọng trong kinh doanh, nhất là trong kỷ nguyên dữ liệu hiện nay.

Qua phần đầu tiên, BAC đã giới thiệu đến bạn đọc khái niệm về Dữ liệu cấu trúc và phi cấu trúc, về những khác biệt cơ bản của hai loại dữ liệu và tầm quan trọng của dữ liệu phi cấu trúc đối với các doanh nghiệp. Trong phần sau chúng ta sẽ tiếp tục tìm hiểu chi tiết hơn về những khác biệt giữa Dữ liệu cấu trúc và phi cấu trúc cùng với các ví dụ và trường hợp sử dụng cụ thể.

Tham khảo: Dữ liệu có cấu trúc và Dữ liệu phi cấu trúc (Phần 2)

Nguồn tham khảo:
https://lawtomated.com/
https://tigosoftware.com/
https://ictnews.vietnamnet.vn/
 

Nhu cầu đào tạo doanh nghiệp

BAC là đơn vị đào tạo BA đầu tiên tại Việt Nam. Đối tác chính thức của IIBA quốc tế. Ngoài các khóa học public, BAC còn có các khóa học in house dành riêng cho từng doanh nghiệp. Chương trình được thiết kế riêng theo yêu cầu của doanh nghiệp, giúp doanh nghiệp giải quyết những khó khăn và tư vấn phát triển.

Tham khảo chương trình đào tạo: 
  • Phân tích và trực quan hóa dữ liệu với Tableau
  • Phân tích và trực quan hóa dữ liệu với Power BI

Các bài viết liên quan Power BI: 

  • Power BI cơ bản cho người mới bắt đầu
  • Chỉnh sửa và định hình dữ liệu trong Power BI Desktop
  • Kết hợp dữ liệu trong Power BI Desktop
  • Hướng dẫn kết nối dữ liệu trong Power BI Desktop
  • Hướng dẫn tải & cài đặt Power BI trên máy tính
  • Khóa học Phân tích và trực quan hóa dữ liệu với Power BI
  • Power BI là gì?

Các bài viết liên quan: 

  • TABLEAU - Giải pháp BUSINESS INTELLIGENCE (BI) - click vào đây
  • Hướng dẫn cài đặt và Sử dụng TABLEAU - click vào đây
  • Tính năng mới trên tableau - verion 2019.1 - click vào đây

Ban biên tập nội dung - BAC

Click để đọc tiếp

  • Các Business Analyst cần trau dồi những công nghệ gì trong năm 2025
    Các Business Analyst cần trau dồi những công nghệ gì trong năm 2025

    Đối với sự phát triển nhanh chóng của công nghệ ngày này, việc không ngừng trau dồi và học hỏi là điều bắt buộc mà các Business Analyst phải làm để phát triển hơn trong lĩnh vực phân tích nghiệp vụ. Trong bài viết này, các bạn hãy cùng BAC tìm hiểu các xu hướng và các kỹ năng mới để làm hành trang trên sự nghiệp Business Analyst nhé!

  • Sự khác biệt giữa UAT và Usability Testing Business Analyst cần lưu ý
    Sự khác biệt giữa UAT và Usability Testing Business Analyst cần lưu ý

    UAT và Usability Testing thường được mang lên bàn cân để so sánh nhưng, đây là 2 phương pháp kiểm thử khác nhau. Trong khi Usability Testing đảm bảo sự hài lòng của người dùng thì UAT lại giúp các Business Analyst xác thực chức năng. Cả hai đều là một phần không thể thiếu để cung cấp một sản phẩm chất lượng cao. Hãy cùng BAC tìm hiểu ngay nhé!

  • API là gì? Khám phá cầu nối giữa các ứng dụng
    API là gì? Khám phá cầu nối giữa các ứng dụng

    API là nền tảng quan trọng kết nối các ứng dụng và dịch vụ trong kỷ nguyên số, tạo ra sự linh hoạt, hiệu quả và mở rộng cho các hệ thống. Bài viết sau giới thiệu API, cách hoạt động, các kiểu kiến trúc phổ biến cùng các công cụ kiểm thử API như Postman.

  • Meta AI là gì và cách sử dụng Meta AI hiệu quả 2025
    Meta AI là gì và cách sử dụng Meta AI hiệu quả 2025

    Meta AI là một công cụ Trí Tuệ Nhân Tạo do chính công ty mẹ của Facebook, Instagram, WhatsApp ra mắt. Đây được xem là một cuộc cách mạng sẽ làm thay đổi cách mà các doanh nghiệp và người dùng sử dụng mạng xã hội.

Bình luận

CÔNG TY CỔ PHẦN ĐÀO TẠO VÀ TƯ VẤN BAC

Mã số doanh nghiệp: 0312713743 do Sở Kế hoạch & Đầu tư TP.HCM cấp ngày 28/03/2014
Trụ sở chính: Lầu 6 - Tòa nhà Thiên Phước 1, 244 Cống Quỳnh, Phường Phạm Ngũ Lão, Quận 1, TP. HCM.
Chi nhánh: Lầu 11, Tòa nhà Hải Âu, Số 39B Trường Sơn, Quận Tân Bình, Tp.HCM.
Email: info@bacs.vn - Web: www.bacs.vn - Điện thoại: (84) 909 310 768

Đã thông báo bộ công thương
DMCA.com Protection Status

Copyright © 2014 BAC JSC.
All Rights Reserved.

BAC - Business Analyst Training Center