- Dịch vụ quản lý dữ liệu mới giúp khách hàng lập danh mục, tìm kiếm, chia sẻ và quản lý dữ liệu xuyên suốt tổ chức của họ…
Tại sự kiện AWS re:Invent, Amazon Web Services đã công bố Amazon DataZone, một dịch vụ quản lý dữ liệu mới giúp khách hàng nhanh chóng và dễ dàng lập danh mục, tìm kiếm, chia sẻ và quản lý dữ liệu được lưu trữ trên các nền tảng như AWS, tại chỗ (on-premise) hay bên thứ ba.
Với Amazon DataZone, quản trị viên và người quản lý tài sản dữ liệu của tổ chức có thể quản lý và chi phối quyền truy cập vào dữ liệu bằng cách sử dụng các biện pháp kiểm soát tốt nhất để đảm bảo dữ liệu được truy cập với quyền và bối cảnh phù hợp.
Amazon DataZone giúp các kỹ sư, nhà khoa học dữ liệu, người quản lý sản phẩm, nhà phân tích và người dùng doanh nghiệp dễ dàng truy cập dữ liệu trong toàn tổ chức để họ có thể tìm kiếm, sử dụng và cộng tác với dữ liệu nhằm có được những hiểu biết sâu sắc (insights) từ thông tin đó.
Amazon DataZone là một dịch vụ quản lý dữ liệu mới giúp nhà cung cấp dữ liệu quản lý và điều chỉnh quyền truy cập dữ liệu dễ dàng hơn, đồng thời cho phép người sử dụng dữ liệu tìm kiếm, sử dụng và cộng tác trên dữ liệu để có những thấu hiểu về hoạt động kinh doanh.
Nhà cung cấp dữ liệu sử dụng cổng web của Amazon DataZone để thiết lập danh mục dữ liệu kinh doanh của riêng họ bằng cách xác định phân loại dữ liệu, cấu hình chính sách quản trị và kết nối với nhiều dịch vụ AWS (ví dụ: Amazon S3 và Amazon Redshift), các giải pháp của đối tác (ví dụ: Salesforce và ServiceNow) và các hệ thống tại chỗ. Amazon DataZone loại bỏ gánh nặng duy trì danh mục bằng cách sử dụng máy học (ML) để thu thập và đề xuất siêu dữ liệu (metadata) (ví dụ: nguồn gốc và loại dữ liệu) cho mỗi tập dữ liệu, và bằng cách đào tạo về phân loại và sở thích của khách hàng để cải thiện theo thời gian.
Sau khi danh mục được thiết lập, người sử dụng dữ liệu có thể sử dụng cổng web Amazon DataZone để tìm kiếm và tra nội dung dữ liệu, kiểm tra siêu dữ liệu theo bối cảnh và yêu cầu quyền truy cập vào các bộ dữ liệu khác nhau. Khi người sử dụng dữ liệu sẵn sàng bắt đầu phân tích dữ liệu, họ sẽ tạo Dự án dữ liệu trên Amazon DataZone - một không gian dùng chung trong cổng web nơi người dùng có thể trích xuất các bộ dữ liệu khác nhau, chia sẻ quyền truy cập với đồng nghiệp và cộng tác trong quá trình phân tích.
Amazon DataZone được tích hợp với các dịch vụ phân tích của AWS, chẳng hạn như Amazon Redshift, Amazon Athena và Amazon QuickSight, cho phép người sử dụng dữ liệu truy cập các dịch vụ này tùy theo bối cảnh dự án dữ liệu của họ, nhờ vậy, họ không cần phải quản lý thông tin xác thực đăng nhập riêng biệt và dữ liệu của họ sẽ tự động có sẵn trong các dịch vụ này. Amazon DataZone cũng cung cấp các giao diện lập trình ứng dụng (API) để tích hợp với các giải pháp hoặc đối tác tùy chỉnh như DataBricks, Snowflake và Tableau để khách hàng có thể dễ dàng xuất bản, tìm kiếm và làm việc với tất cả các tài sản dữ liệu của họ.
Swami Sivasubramanian, phó chủ tịch Cơ sở dữ liệu, Phân tích và Máy học tại AWS, cho biết: “Quản trị tốt là nền tảng giúp toàn bộ tổ chức có thể truy cập dữ liệu, tuy nhiên chúng tôi thường nghe khách hàng chia sẻ rằng họ rất khó để đạt được sự cân bằng hợp lý giữa việc làm cho dữ liệu có thể khám phá được và duy trì quyền kiểm soát. Với Amazon DataZone, khách hàng có thể sử dụng một dịch vụ cân bằng giữa các biện pháp kiểm soát quản trị mạnh mẽ với quyền truy cập hợp lý để giúp dễ dàng tìm kiếm, sắp xếp và cộng tác với dữ liệu. Amazon DataZone tạo ra tính tự do dữ liệu trong toàn tổ chức, vì vậy mọi nhân viên có thể có những thấu hiểu mới về dữ liệu để tối đa hóa giá trị của nó”.
Phạm Lê