OneLake – Phiên bản lưu trữ dữ liệu khác của OneDrive

OneLake là một kho dữ liệu hợp lý, thống nhất cho toàn bộ tổ chức. Tương tự như OneDrive, OneLake sẽ tự động đi kèm với Microsoft Fabric và được thiết kế để trở thành một vị trí lưu trữ duy nhất cho tất cả dữ liệu phân tích của bạn. Ngoài ra, OneLake mang đến cho khách hàng:

  • Kho dữ liệu cho toàn bộ tổ chức
  • Bản sao dữ liệu để sử dụng với nhiều công cụ phân tích

Kho dữ liệu cho toàn bộ tổ chức

Trước khi OneLake ra mắt, khách hàng sẽ dễ dàng lưu trữ dữ liệu trên nhiều ổ chứa hơn là một ổ duy nhất cho các nhóm doanh nghiệp khác nhau, thậm chí sau khi đã tăng mạnh chi phí quản lý tài nguyên. OneLake tập trung vào việc loại bỏ những thách thức này bằng cách cải thiện vấn đề tương tác. Mỗi đối tượng khách hàng chỉ có duy nhất một OneLake. Không nhiều hơn hay ít hơn nếu bạn có dùng Fabric. OneLake được tự động cung cấp cho mọi đối tượng dùng Fabric mà không cần thêm tài nguyên để thiết lập hoặc quản lý.

Khái niệm người dùng (tenant) được xem một lợi ích độc đáo của dịch vụ SaaS. Chức năng này cho phép nắm bắt vị trí bắt đầu và kết thúc của tổ chức, cung cấp ranh giới tuân thủ và năng lực tự quản trị, cuối cùng nằm dưới sự kiểm soát của quản trị viên người dùng. Bất kỳ dữ liệu nào của OneLake đều được quản lý mặc định. Mặc dù tất cả dữ liệu đều nằm dưới quyền kiểm soát của quản trị viên, nhưng điều quan trọng là quản trị viên này không trở thành người ngăn cản các bộ phận khác của tổ chức đóng góp cho OneLake. Đối với tính năng người dùng, bạn có thể tạo bất kỳ không gian làm việc nào trên OneLake. Không gian làm việc cho phép các bộ phận khác nhau của tổ chức phân phối chính sách quyền sở hữu và quyền truy cập. Mỗi không gian làm việc là một phần của sức chứa được gắn với một khu vực cụ thể và được lập hóa đơn riêng.

Trong một không gian làm việc, bạn có thể tạo các mục dữ liệu và toàn bộ dữ liệu trong OneLake được truy cập thông qua các mục dữ liệu. Tương tự như cách Office lưu trữ các tệp Word, Excel và PowerPoint trong OneDrive, Fabric lưu trữ Lakehouses, Warehouses và các mục khác trong OneLake. Các mục chứa dữ liệu có thể mang lại trải nghiệm phù hợp cho từng người, chẳng hạn như trải nghiệm của nhà phát triển Spark trong Data Lake.

OneLake được mở ở mọi cấp độ. Được xây dựng dựa trên Azure Data Lake Storage Gen2, OneLake có thể hỗ trợ bất kỳ loại tệp nào, có cấu trúc hoặc phi cấu trúc. Tất cả các mục dữ liệu Fabric như dữ liệu Warehouses và Lakehouses tự động lưu trữ dữ liệu của chúng trong OneLake ở định dạng Delta Parquet. Điều này có nghĩa là khi một Data Engineer tải dữ liệu vào kho Lakehouse bằng Spark và SQL Developer trong kho dữ liệu Warehouse sử dụng T-SQL để tải dữ liệu, tất cả đều đang đóng góp để xây dựng cùng một Data Lake. Dữ liệu dạng bảng ౼ Tabular Data được lưu trữ trong OneLake ở định dạng Delta Parquet. OneLake hỗ trợ các API và SDK ADLS Gen2 tương tự để tương thích với các ứng dụng ADLS Gen2 hiện có bao gồm cả Azure Databricks. Dữ liệu trong OneLake có thể được xử lý như thể đó là một tài khoản lưu trữ ADLS lớn cho toàn bộ tổ chức. Mọi không gian làm việc xuất hiện dưới dạng vùng chứa trong tài khoản lưu trữ đó.

OneLake là một dạng OneDrive dành cho lưu trữ dữ liệu. Cũng giống như OneDrive, có thể dễ dàng khám phá dữ liệu OneLake từ Windows bằng trình duyệt tệp OneLake dành cho Windows. Được thao tác trực tiếp trong Windows, bạn có thể điều hướng tất cả không gian làm việc, mục dữ liệu, dễ dàng tải lên, tải xuống hoặc sửa đổi tệp như thể bạn đang thực hiện trong văn phòng. Trình duyệt tệp OneLake ౼ OneLake File Explorer đơn giản hóa kho dữ liệu và thậm chí người dùng doanh nghiệp phi kỹ thuật cũng có thể thao tác.

Lưu trữ một số bản sao dữ liệu

OneLake nhắm tới mục tiêu mang lại cho bạn giá trị cao nhất có thể từ một bản sao dữ liệu mà không cần di chuyển hoặc sao chép dữ liệu. Bạn sẽ không còn cần phải sao chép dữ liệu chỉ để sử dụng nó với một công cụ khác hoặc phá vỡ các Silo để dữ liệu có thể được phân tích với dữ liệu khác.

Lối tắt cho phép tổ chức của bạn dễ dàng chia sẻ dữ liệu giữa người dùng và ứng dụng mà không phải di chuyển và sao chép thông tin một cách không cần thiết. Khi các nhóm làm việc độc lập trong các không gian làm việc riêng biệt, lối tắt cho phép bạn kết hợp dữ liệu giữa các nhóm và tên miền doanh nghiệp khác nhau thành một sản phẩm dữ liệu ảo để phù hợp với nhu cầu cụ thể của người dùng. Một lối tắt là một tham chiếu đến dữ liệu được lưu trữ ở các vị trí tệp khác. Các vị trí tệp này có thể nằm trong cùng một không gian làm việc hoặc trên các không gian làm việc khác nhau, bên trong OneLake hoặc bên ngoài OneLake trong ADLS hoặc S3. Bất kể vị trí, tham chiếu làm cho nó xuất hiện như thể các tệp và thư mục được lưu trữ cục bộ.

Mặc dù các ứng dụng có thể tách biệt giữa lưu trữ và tính toán, nhưng dữ liệu thường được tối ưu hóa cho một công cụ duy nhất, điều này gây khó khăn cho việc sử dụng lại cùng một dữ liệu cho nhiều ứng dụng. Với Fabric, các công cụ phân tích khác nhau (T-SQL, Spark, Analysis Services, v.v.) lưu trữ dữ liệu ở định dạng Delta Parquet mở để cho phép bạn sử dụng cùng một dữ liệu trên nhiều công cụ. Không còn cần phải sao chép dữ liệu chỉ để sử dụng nó với một công cụ khác. Bạn luôn có thể chọn công cụ tốt nhất cho công việc của bạn. Ví dụ: hãy tưởng tượng bạn có một nhóm kỹ sư SQL đang xây dựng toàn bộ giao dịch trong kho dữ liệu Warehouses. Họ có thể sử dụng công cụ T-SQL và tất cả tính năng của T-SQL để tạo bảng, chuyển đổi và tải dữ liệu vào bảng. Nếu một nhà khoa học dữ liệu muốn sử dụng dữ liệu này, họ không cần phải thông qua trình điều khiển Spark/SQL nữa. Tất cả dữ liệu được lưu trữ trong OneLake ở định dạng Delta Parquet. Các nhà khoa học dữ liệu có thể sử dụng toàn bộ chức năng của công cụ Spark và các thư viện nguồn mở của nó để phân tích trực tiếp trên dữ liệu.

Người dùng doanh nghiệp có thể tạo báo cáo Power BI trực tiếp trên OneLake bằng cách sử dụng chế độ Direct Lake Mode mới trong công cụ Analysis Services. Công cụ Analysis Services (tạm dịch: Dịch vụ Phân tích) là thứ cung cấp năng lượng cho Bộ dữ liệu Power BI và luôn cung cấp hai chế độ truy cập dữ liệu bao gồm nhập và truy vấn trực tiếp. Chế độ Direct Lake Mode cung cấp cho người dùng tối ưu tốc độ nhập mà không cần sao chép dữ liệu, kết hợp tốt nhất giữa nhập và truy vấn trực tiếp. Tìm hiểu thêm về Direct Lake: https://aka.ms/DirectLake.

Sơ đồ ví dụ hiển thị tải dữ liệu bằng Spark, truy vấn bằng T-SQL và xem dữ liệu trong báo cáo Power BI

Nguồn: https://learn.microsoft.com/en-us/fabric/onelake/onelake-overview?fbclid=IwAR2l-Vx3tGcDS8F3MpsYVH-ZRaAinzZmYctPv6n7zXE0KOpKoM-qSehYXy4

Vina Aspire là Công ty tư vấn, cung cấp các giải pháp, dịch vụ CNTT, An ninh mạng, bảo mật & an toàn thông tin tại Việt Nam. Đội ngũ của Vina Aspire gồm những chuyên gia, cộng tác viên giỏi, có trình độ, kinh nghiệm và uy tín cùng các nhà đầu tư, đối tác lớn trong và ngoài nước chung tay xây dựng.

Các Doanh nghiệp, tổ chức có nhu cầu liên hệ Công ty Vina Aspire theo thông tin sau:

Email: info@vina-aspire.com | Website: www.vina-aspire.com
Tel: +84 944 004 666 | Fax: +84 28 3535 0668


Vina Aspire – Vững bảo mật, trọn niềm tin

 


Bài viết liên quan

About Us

Learn More

Vina Aspire is a leading Cyber Security & IT solution and service provider in Vietnam. Vina Aspire is built up by our excellent experts, collaborators with high-qualification and experiences and our international investors and partners. We have intellectual, ambitious people who are putting great effort to provide high quality products and services as well as creating values for customers and society.

may ao thun Kem sữa chua May o thun May o thun đồng phục Định cư Canada Dịch vụ kế ton trọn gi sản xuất đồ bộ
Translate »