Thuật ngữ nào sau đây là thuật ngữ phổ biến để biểu diễn dữ liệu đa chiều?

Khối dữ liệu đề cập đến là một phạm vi giá trị ba chiều (3D) (hoặc cao hơn) thường được sử dụng để giải thích trình tự thời gian của dữ liệu hình ảnh. Nó là một trừu tượng hóa dữ liệu để đánh giá dữ liệu tổng hợp từ nhiều quan điểm khác nhau. Nó cũng hữu ích cho quang phổ hình ảnh vì hình ảnh được phân giải quang phổ được mô tả dưới dạng tập 3-D.

Quảng cáo

Một khối dữ liệu cũng có thể được mô tả như là phần mở rộng nhiều chiều của bảng hai chiều. Nó có thể được xem như một tập hợp các bảng 2-D giống hệt nhau được xếp chồng lên nhau. Các khối dữ liệu được sử dụng để biểu diễn dữ liệu quá phức tạp để được mô tả bằng một bảng cột và hàng. Như vậy, các khối dữ liệu có thể vượt xa 3-D để bao gồm nhiều kích thước khác.

Một khối dữ liệu thường được sử dụng để dễ dàng diễn giải dữ liệu. Nó đặc biệt hữu ích khi biểu diễn dữ liệu cùng với các thứ nguyên như là các thước đo nhất định của các yêu cầu kinh doanh. Mọi kích thước của một khối đại diện cho một số đặc điểm nhất định của cơ sở dữ liệu, ví dụ: doanh số hàng ngày, hàng tháng hoặc hàng năm. Dữ liệu được bao gồm bên trong khối dữ liệu giúp nó có thể phân tích hầu như tất cả các số liệu cho hầu như bất kỳ hoặc tất cả khách hàng, đại lý bán hàng, sản phẩm, v.v. Do đó, một khối dữ liệu có thể giúp thiết lập xu hướng và phân tích hiệu suất.

OLAP

Là thành phần cốt lõi của việc triển khai kho dữ liệu, OLAP cho phép phân tích dữ liệu đa chiều nhanh chóng, linh hoạt cho các ứng dụng hỗ trợ quyết định và thông minh kinh doanh (BI).

OLAP là gì?

OLAP (để xử lý phân tích trực tuyến) là phần mềm để thực hiện phân tích đa chiều ở tốc độ cao trên khối lượng lớn dữ liệu từ kho dữ liệu, trung tâm dữ liệu hoặc một số kho dữ liệu tập trung, thống nhất khác.

Hầu hết dữ liệu kinh doanh có nhiều thứ nguyên — nhiều danh mục trong đó dữ liệu được chia nhỏ để trình bày, theo dõi hoặc phân tích. Ví dụ: số liệu bán hàng có thể có nhiều thứ nguyên liên quan đến vị trí (khu vực, quốc gia, tiểu bang / tỉnh, cửa hàng), thời gian (năm, tháng, tuần, ngày), sản phẩm (quần áo, nam / nữ / trẻ em, thương hiệu, loại), và nhiều hơn nữa.

Nhưng trong kho dữ liệu, các tập dữ liệu được lưu trữ trong các bảng, mỗi bảng có thể tổ chức dữ liệu thành chỉ hai trong số các kích thước này tại một thời điểm. OLAP trích xuất dữ liệu từ nhiều tập dữ liệu quan hệ và tổ chức lại nó thành một định dạng đa chiều cho phép xử lý rất nhanh và phân tích rất sâu sắc.

Khối lập phương OLAP là gì?

Cốt lõi của hầu hết các hệ thống OLAP, khối lập phương OLAP là cơ sở dữ liệu đa chiều dựa trên mảng giúp xử lý và phân tích nhiều chiều dữ liệu nhanh hơn và hiệu quả hơn nhiều so với cơ sở dữ liệu quan hệ truyền thống.

Một bảng cơ sở dữ liệu quan hệ được cấu trúc giống như một bảng tính, lưu trữ các bản ghi riêng lẻ ở định dạng hai chiều, theo hàng và cột. Mỗi dữ liệu “thực tế” trong cơ sở dữ liệu nằm ở giao điểm của hai thứ nguyên – một hàng và một cột — chẳng hạn như khu vực và tổng doanh số bán hàng.

Các công cụ báo cáo cơ sở dữ liệu quan hệ và SQL chắc chắn có thể truy vấn, báo cáo và phân tích dữ liệu đa chiều được lưu trữ trong bảng, nhưng hiệu suất sẽ chậm lại khi khối lượng dữ liệu tăng lên. Và nó đòi hỏi rất nhiều công việc để sắp xếp lại các kết quả để tập trung vào các chiều khác nhau.

Đây là nơi xuất hiện của khối OLAP. Khối OLAP mở rộng bảng đơn với các lớp bổ sung, mỗi lớp thêm các thứ nguyên bổ sung — thường là cấp tiếp theo trong “phân cấp khái niệm” của thứ nguyên. Ví dụ: lớp trên cùng của khối lập phương có thể tổ chức bán hàng theo khu vực; các lớp bổ sung có thể là quốc gia, tiểu bang / tỉnh, thành phố và thậm chí cả cửa hàng cụ thể.

Về lý thuyết, một khối lập phương có thể chứa vô số lớp. (Một hình khối OLAP đại diện cho nhiều hơn ba chiều đôi khi được gọi là siêu hình lập phương.) Và các hình khối nhỏ hơn có thể tồn tại trong các lớp — ví dụ: mỗi lớp cửa hàng có thể chứa các hình khối sắp xếp doanh số theo nhân viên bán hàng và sản phẩm. Trên thực tế, các nhà phân tích dữ liệu sẽ tạo các khối OLAP chỉ chứa các lớp mà họ cần để phân tích và hiệu suất tối ưu.

Thuật ngữ nào sau đây là thuật ngữ phổ biến để biểu diễn dữ liệu đa chiều?

Các khối OLAP cho phép bốn kiểu phân tích dữ liệu đa chiều cơ bản:

Đi sâu vào

Hoạt động chi tiết chuyển đổi dữ liệu ít chi tiết hơn thành dữ liệu chi tiết hơn thông qua một trong hai phương pháp — di chuyển xuống trong phân cấp khái niệm hoặc thêm một kích thước mới vào khối lập phương. Ví dụ: nếu bạn xem dữ liệu bán hàng cho lịch của tổ chức hoặc quý tài chính, bạn có thể xem chi tiết doanh số bán hàng cho mỗi tháng, di chuyển xuống trong phân cấp khái niệm của thứ nguyên “thời gian”.

Cuộn lại

Cuộn lên ngược lại với chức năng xem chi tiết — nó tổng hợp dữ liệu trên một khối OLAP bằng cách di chuyển lên trong phân cấp khái niệm hoặc bằng cách giảm số thứ nguyên. Ví dụ: bạn có thể tăng lên trong phân cấp khái niệm của thứ nguyên “vị trí” bằng cách xem dữ liệu của từng quốc gia, thay vì từng thành phố.

Xắt từng lát mỏng

Thao tác cắt lát tạo ra một khối phụ bằng cách chọn một kích thước duy nhất từ ​​khối OLAP chính. Ví dụ: bạn có thể thực hiện một phần bằng cách đánh dấu tất cả dữ liệu cho quý tài chính hoặc lịch đầu tiên của tổ chức (thứ nguyên thời gian).

Thao tác xúc xắc cô lập một khối phụ bằng cách chọn một số kích thước bên trong khối OLAP chính. Ví dụ: bạn có thể thực hiện thao tác xúc xắc bằng cách đánh dấu tất cả dữ liệu theo lịch hoặc quý tài chính của tổ chức (thứ nguyên thời gian) và ở Hoa Kỳ và Canada (thứ nguyên vị trí).

Trục

Hàm pivot xoay chế độ xem hình khối hiện tại để hiển thị một biểu diễn mới của dữ liệu — cho phép các chế độ xem đa chiều động của dữ liệu. Chức năng tổng hợp OLAP có thể so sánh với tính năng bảng tổng hợp trong phần mềm bảng tính, chẳng hạn như Microsoft Excel, nhưng trong khi bảng tổng hợp trong Excel có thể khó khăn, thì các bản tổng hợp OLAP tương đối dễ sử dụng hơn (yêu cầu ít chuyên môn hơn) và có thời gian phản hồi nhanh hơn và hiệu suất truy vấn.

MOLAP so với ROLAP so với HOLAP

OLAP hoạt động trực tiếp với khối OLAP đa chiều được gọi là OLAP đa chiều, hoặc MOLAP. Một lần nữa, đối với hầu hết các mục đích sử dụng, MOLAP là loại phân tích dữ liệu đa chiều nhanh nhất và thiết thực nhất.

Tuy nhiên, có hai loại OLAP khác có thể thích hợp hơn trong một số trường hợp nhất định:

ROLAP

ROLAP, hay OLAP quan hệ, là phân tích dữ liệu đa chiều hoạt động trực tiếp trên dữ liệu trên các bảng quan hệ mà không cần tổ chức lại dữ liệu thành một khối lập phương trước.

Như đã đề cập trước đây, SQL là một công cụ có khả năng hoàn hảo cho các truy vấn, báo cáo và phân tích đa chiều. Nhưng các truy vấn SQL được yêu cầu rất phức tạp, hiệu suất có thể kéo và chế độ xem kết quả của dữ liệu là tĩnh — không thể xoay vòng để biểu thị một chế độ xem khác của dữ liệu. ROLAP là tốt nhất khi khả năng làm việc trực tiếp với lượng lớn dữ liệu quan trọng hơn hiệu suất và tính linh hoạt.

HOLAP

HOLAP, hoặc OLAP kết hợp, cố gắng tạo ra sự phân công lao động tối ưu giữa cơ sở dữ liệu quan hệ và đa chiều trong một kiến ​​trúc OLAP duy nhất. Các bảng quan hệ chứa số lượng dữ liệu lớn hơn và các khối OLAP được sử dụng để tổng hợp và xử lý suy đoán. HOLAP yêu cầu máy chủ OLAP hỗ trợ cả MOLAP và ROLAP.

Công cụ HOLAP có thể “đi sâu” khối dữ liệu đến các bảng quan hệ, mở đường cho việc xử lý dữ liệu nhanh chóng và truy cập linh hoạt. Hệ thống kết hợp này có thể cung cấp khả năng mở rộng tốt hơn nhưng không thể tránh khỏi tình trạng chậm chắc chắn khi truy cập các nguồn dữ liệu quan hệ. Ngoài ra, kiến ​​trúc phức tạp của nó thường yêu cầu cập nhật và bảo trì thường xuyên hơn, vì nó phải lưu trữ và xử lý tất cả dữ liệu từ cơ sở dữ liệu quan hệ và cơ sở dữ liệu đa chiều. Vì lý do này, HOLAP cuối cùng có thể đắt hơn.

OLAP so với OLTP

Xử lý giao dịch trực tuyến, hay OLTP, đề cập đến các phương pháp và phần mềm xử lý dữ liệu tập trung vào dữ liệu và ứng dụng hướng giao dịch.

Sự khác biệt chính giữa OLAP và OLTP nằm ở tên gọi: OLAP mang tính chất phân tích và OLTP mang tính chất giao dịch.

Các công cụ OLAP được thiết kế để phân tích đa chiều dữ liệu trong kho dữ liệu, chứa cả dữ liệu giao dịch và dữ liệu lịch sử. Trên thực tế, máy chủ OLAP thường là cấp phân tích trung gian của giải pháp lưu trữ dữ liệu. Các ứng dụng phổ biến của OLAP bao gồm khai thác dữ liệu và các ứng dụng thông minh kinh doanh khác, tính toán phân tích phức tạp và các kịch bản dự đoán, cũng như các chức năng báo cáo kinh doanh như phân tích tài chính, lập ngân sách và lập kế hoạch dự báo.

OLTP được thiết kế để hỗ trợ các ứng dụng hướng đến giao dịch bằng cách xử lý các giao dịch gần đây một cách nhanh chóng và chính xác nhất có thể. Các ứng dụng phổ biến của OLTP bao gồm máy ATM, phần mềm thương mại điện tử, xử lý thanh toán bằng thẻ tín dụng, đặt chỗ trực tuyến, hệ thống đặt chỗ và các công cụ lưu trữ hồ sơ.

Để tìm hiểu sâu hơn về sự khác biệt giữa các phương pháp này, hãy xem “OLAP so với OLTP: Sự khác biệt là gì?”

OLAP và kiến ​​trúc đám mây

OLAP cho phép các công ty tối đa hóa tiềm năng của dữ liệu doanh nghiệp của họ bằng cách chuyển nó thành định dạng thiết thực nhất để phân tích đa chiều. Do đó, điều này giúp bạn dễ dàng nhận ra những thông tin chi tiết có giá trị về doanh nghiệp. Tuy nhiên, nếu các hệ thống này được giữ trong nhà, nó sẽ hạn chế khả năng mở rộng quy mô.

Các dịch vụ OLAP dựa trên đám mây ít tốn kém hơn và dễ thiết lập hơn, khiến chúng trở nên hấp dẫn hơn đối với các doanh nghiệp nhỏ hoặc công ty mới khởi nghiệp với ngân sách tiết kiệm. Các doanh nghiệp có thể khai thác tiềm năng to lớn của các kho dữ liệu dựa trên đám mây thực hiện các phép phân tích tinh vi với tốc độ vô song vì chúng sử dụng quy trình xử lý song song (MPP) hàng loạt. Do đó, các công ty có thể sử dụng OLAP ở tốc độ và quy mô đám mây, phân tích một lượng lớn dữ liệu mà không cần di chuyển nó khỏi kho dữ liệu đám mây của họ.

Constance Hotels, Resorts & Golf là một tập đoàn khách sạn sang trọng với chín khách sạn trên các hòn đảo ở Ấn Độ Dương. Tuy nhiên, việc thiếu thông tin liên lạc từ đảo này sang đảo khác đã nhường chỗ cho các hầm chứa tổ chức, với dữ liệu kinh doanh bị cô lập trong mỗi khu nghỉ dưỡng. Tổ chức đã xây dựng một kho dữ liệu đám mây và kiến ​​trúc phân tích để liên kết tất cả các hệ thống và công cụ tại chỗ với một kho dữ liệu trung tâm dựa trên đám mây. Khi làm điều này, công ty đã có được cái nhìn sâu sắc trong toàn nhóm mà họ cần để tận dụng các phân tích tiên đoán, nâng cao và triển khai hệ thống OLAP.

OLAP trong kiến ​​trúc đám mây là một giải pháp nhanh chóng và tiết kiệm chi phí được xây dựng cho tương lai. Sau khi các hình khối được tạo ra, các nhóm có thể sử dụng các công cụ thông minh kinh doanh hiện có để kết nối ngay lập tức với mô hình OLAP và rút ra thông tin chi tiết tương tác theo thời gian thực từ dữ liệu đám mây của họ.

OLAP và IBM Cloud

IBM Db2 Warehouse trên Đám mây là một dịch vụ đám mây công cộng được quản lý. Bạn có thể thiết lập IBM Db2 Warehouse tại chỗ bằng phần cứng của mình hoặc trong một đám mây riêng. Là một kho dữ liệu, dịch vụ này bao gồm các tính năng như xử lý dữ liệu trong bộ nhớ và các bảng cột để xử lý phân tích trực tuyến (OLAP). Vì các tính năng này chia sẻ một công cụ cơ sở dữ liệu chung, bạn có thể dễ dàng tối ưu hóa hoặc di chuyển khối lượng công việc dữ liệu.

Các nhóm cũng có thể sử dụng Dịch vụ khối của IBM để tạo, chỉnh sửa, nhập, xuất và triển khai các mô hình khối lập phương OLAP trên lược đồ kho quan hệ. Dịch vụ này cung cấp một cái nhìn đa chiều về dữ liệu được lưu trữ trong cơ sở dữ liệu quan hệ để tối ưu hóa và nâng cao hiệu suất của các truy vấn OLAP.

Đăng ký IBMid và tạo tài khoản IBM Cloud của bạn.

Một khối dữ liệu cũng có thể được mô tả như là phần mở rộng nhiều chiều của bảng hai chiều. Nó có thể được xem như một tập hợp các bảng 2-D giống hệt nhau được xếp chồng lên nhau. Các khối dữ liệu được sử dụng để biểu diễn dữ liệu quá phức tạp để được mô tả bằng một bảng cột và hàng.

OLAP (xử lý phân tích trực tuyến) và lưu trữ dữ liệu sử dụng cơ sở dữ liệu đa chiều. Nó được sử dụng để hiển thị nhiều chiều của dữ liệu cho người dùng.

Cơ sở dữ liệu đa chiều được sử dụng hầu hết cho OLAP (xử lý phân tích trực tuyến) và lưu trữ dữ liệu. Chúng có thể được sử dụng để hiển thị nhiều chiều dữ liệu cho người dùng.

Một mô hình đa chiều xem dữ liệu ở dạng khối dữ liệu. Một khối dữ liệu cho phép dữ liệu được mô hình hóa và xem theo nhiều chiều. Nó được xác định bởi các kích thước và sự kiện. Các thứ nguyên là các quan điểm hoặc thực thể liên quan đến việc một tổ chức lưu giữ hồ sơ.

Bạn đang xem chuyên mục Hỏi đáp
Thuộc website web giải đáp

Quảng cáo
Hỏi đáp

Leave a Reply

Email của bạn sẽ không được hiển thị công khai.

You may use these HTML tags and attributes:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>