Doanh nghiệp bứt phá trên thị trường nhờ khai thác dữ liệu

0
0

- Dữ liệu phi cấu trúc đã và đang tăng trưởng với một tốc độ chóng mặt và góp phần quan trọng trong việc phát triển các doanh nghiệp. Thực tế này khiến các doanh nghiệp đứng trước những cơ hội và thử thách lớn chưa từng có trong việc tận dụng tiềm năng của chính mình và bứt phá trên thị trường thông qua việc khai thác dữ liệu sẵn có.

Một trong những câu trả lời cho bài toán này chính là việc ứng dụng những công nghệ phân tích dữ liệu lớn (big data analytics) và hồ dữ liệu (data lake).

Mỗi doanh nghiệp đều có rất nhiều loại dữ liệu khác nhau, từ những cơ sở dữ liệu có cấu trúc, những dữ liệu về thông tin và hành vi khách hàng, những dữ liệu video được ghi lại từ hệ thống camera cho đến những dữ liệu thô như log file sinh ra từ những thiết bị trong hạ tầng CNTT và truyền dẫn.

Tất cả những dữ liệu này đều có thể đem đến những thông tin mới mẻ cho doanh nghiệp khi kết hợp chúng lại với nhau.

Tuy nhiên những dữ liệu này thường nằm rải rác ở nhiều nơi trên nhiều hệ thống khác nhau, dẫn đến việc doanh nghiệp khó kết hợp và tìm ra được những thông tin mới từ các hệ thống rời rạc này.

Không chỉ như vậy, những dữ liệu này thường được sinh ra với tốc độ cao trong khi năng lực của từng hệ thống đơn lẻ lại có giới hạn, dẫn đến doanh nghiệp phải bỏ đi rất nhiều dữ liệu mà chưa kịp khai thác.

Data lake sẽ là lời giải cho vấn đề trên của doanh nghiệp. Data lake là một nơi tập trung lưu trữ tất cả các loại dữ liệu của doanh nghiệp ở định dạng gốc, qua đó các giải pháp và kỹ thuật phân tích sẽ có thể truy cập tất cả những dữ liệu này mà không cần truy cập rải rác các hệ thống khác nhau.

Data lake có khả năng mở rộng với dung lượng lớn và nhanh, qua đó doanh nghiệp sẽ không lãng phí những dữ liệu chưa kịp khai thác và việc lưu trữ được dữ liệu với định dạng gốc sẽ giúp bỏ lỡ những thông tin ẩn giấu bên trong những dữ liệu đó.

Kiến trúc hệ thống Hadoop truyền thống
Kiến trúc hệ thống Hadoop truyền thống

Trên thị trường hiện tại, các giải pháp phân tích dữ liệu và data lake trên thế giới và Việt Nam thường được triển khai trên nền tảng dữ liệu phân tán Hadoop. Trước đây, với mô hình triển khai truyền thống của Hadoop đó là sử dụng hạ tầng máy chủ cho tất cả các tác vụ của hệ thống bao gồm tính toán (compute) và lưu trữ (storage), hệ thống này thường gặp một số bất cập.

Để giải quyết điều này, Dell EMC cung cấp đến các doanh nghiệp giải pháp lưu trữ PowerScale - Scale-Out NAS.

PowerScale giải quyết các vấn đề của kiến trúc Hadoop truyền thống nhờ những khả năng tích hợp sẵn tính năng HDFS, giúp giảm tải phần storage hoàn toàn lên PowerScale, Hadoop cluster chỉ còn đóng vai trò compute. Hai thành phần compute và storage có thể mở rộng độc lập và không gây tình trạng lãng phí như trước.

Hỗ trợ đa giao thức, một dữ liệu có thể được truy cập đồng thời qua các giao thức NAS và cả HDFS, không cần phải có hệ thống trung gian như kiến trúc truyền thống.

Kiến trúc hệ thống Hadoop và Dell EMC PowerScale
Kiến trúc hệ thống Hadoop và Dell EMC PowerScale

PowerScale cung cấp cùng một mức độ bảo vệ dữ liệu, thậm chí cao hơn mức bảo vệ truyền thống với một tỷ lệ dữ liệu khả dụng cao hơn nhiều, lên đến 85% dữ liệu thô.

Khả năng mở rộng dung lượng rất lớn và thao tác mở rộng dễ dàng. Tương thích với hầu hết các phiên bản Hadoop và đặc biệt được chứng nhận tương thích với giải pháp Cloudera CDP.

Thông qua việc kết hợp Hadoop với Dell EMC PowerScale, các doanh nghiệp không cần lo lắng về việc lưu trữ dữ liệu trong data lake của mình mà chỉ cần tập trung vào việc phát triển ứng dụng phân tích dữ liệu, tạo ra những giá trị mới từ chính những dữ liệu của mình.

Phạm Lê


Ý kiến bạn đọc


Hai cách thanh toán cước VinaPhone trả sau online đơn giản

(VnMedia) - Bạn đang dùng thuê bao di động trả sau của nhà mạng VinaPhone và muốn thanh toán cước phí online? Bài viết dưới đây sẽ mách người dùng 2 cách thanh toán cước VinaPhone trả sau online đơn giản, nhanh gọn.

U20 Việt Nam đã đến Nhật Bản, sẵn sàng cho 3 trận đấu quan trọng!

(VnMedia) - Thày trò HLV Đinh Thế Nam đã có mặt tại Nhật Bản sau chuyến bay khá dài, chính thức bước vào đợt tập huấn trong vòng 2 tuần tại xứ sở mặt trời mọc. Trong quá trình tập huấn tại Nhật Bản, ĐT U20 Việt Nam sẽ được sắp xếp thi đấu giao hữu 3 trận...

Xử lý 01 đại lý bán lẻ xăng dầu có hành vi niêm yết giá bán lẻ xăng dầu không đúng

(VnMedia) - Cục Quản lý thị trường Kiên Giang đã chỉ đạo Đội Quản lý thị trường số 5 kiểm tra, xử lý 01 đại lý bán lẻ xăng dầu niêm yết giá bán lẻ xăng dầu không đúng với giá do thương nhân phân phối xăng dầu quy định.

Giáo sư, tiến sĩ về Bình Định làm việc được hỗ trợ đến 800 triệu đồng

(VnMedia) - Đó là một trong những nội dung của Nghị quyết ban hành quy định chính sách thu hút nguồn nhân lực chất lượng cao và hỗ trợ phát triển nguồn nhân lực tỉnh Bình Định giai đoạn 2022 - 2025. 

Hà Nội: Lái xe có dấu hiệu say xỉn lao vào cây xăng làm 8 người bị thương

(VnMedia) - Công an quận Đống Đa (TP Hà Nội) cho biết, đang khẩn trương điều tra vụ tai nạn giao thông giữa xe ô tô và hàng loạt xe máy ở cây xăng 111 đường Láng, phường Thịnh Quang.