Những thành tựu ấn tượng của IBM trong lĩnh vực trí tuệ nhân tạo năm 2018

06:05, 03/02/2019
|

 - Bản tổng kết năm 2018 này đưa ra một vài gợi ý về tương lai của AI trong ba lĩnh vực chính: phát triển AI, tin tưởng AI và nhân rộng AI - cùng một số dự đoán về tương lai.

Trong hơn bảy mươi năm qua, Bộ phận Nghiên cứu của IBM (IBM Research) đã không ngừng phát minh, khám phá và tưởng tượng về tương lai. Arthur Samuel, một nhân viên IBM và là nhà tiên phong thời đầu của máy tính, đã đặt ra thuật ngữ machine learning (học máy). Và kể từ đó đến nay, IBM luôn đưa ra dự đoán về những bước đi tiếp theo của lĩnh vực này và cách con người chúng ta sẽ đi đến đó.

Bản tổng kết năm 2018 này sẽ đưa ra một vài gợi ý về tương lai của AI. Trong năm 2018, IBM đã xuất bản hơn 100 tài liệu về AI của bộ phận IBM Research, do các nhà nghiên cứu và các nhà khoa học tài năng từ mười hai phòng thí nghiệm toàn cầu của IBM là tác giả. Những tiến bộ khoa học này là cốt lõi cho sứ mệnh của IBM - đó là phát minh ra những công nghệ AI cơ bản tiếp theo để đưa chúng ta từ AI hiểu theo "diện hẹp" ngày nay sang kỷ nguyên mới của AI "diện rộng", nơi tiềm năng của công nghệ có thể được khai phá nhờ các nhà phát triển và lập trình AI cũng như người dùng doanh nghiệp và người dùng cá nhân.

AI "diện rộng" sẽ có những đặc trưng bởi khả năng học hỏi và lập luận rộng hơn trong các nhiệm vụ, để tích hợp thông tin từ nhiều phương thức và lĩnh vực, đồng thời dễ giải thích hơn, an toàn bảo mật, công bằng hơn, có thể kiểm toán được và có thể mở rộng hơn.

Một số thành tựu của IBM  

Phát triển AI

AI thực sự nghe thấy những gì bạn đang nói: IBM Research đã phát triển năng lực Nghe hiểu Máy đối với nội dung tranh biện. Xuất phát từ thành công ban đầu đối với IBM Project Debater (công nghệ AI đã chiến thắng con người trong một cuộc thi tại San Francisco hồi tháng 6/2018), chức năng này mở rộng khả năng nghe hiểu lời nói hiện tại của AI, không chỉ dừng lại các nhiệm vụ trả lời câu hỏi đơn giản, từ đó cho phép máy móc hiểu rõ hơn khi con người đưa ra các lập luận.

Xem một, biết mười: Hiện nay, các phương pháp của AI thường đòi hỏi có hàng nghìn, hoặc thậm chí là hàng triệu các hình ảnh được dán nhãn thì mới có thể huấn luyện chính xác một mô hình nhận diện hình ảnh. IBM Research đã phát triển một phương pháp học tập mới có thể nhận diện chính xác những vật thể mới chỉ từ vài ví dụ, không cần có dữ liệu bổ sung hay dán nhãn hình ảnh. Năng lực này mở rộng khả năng ứng dụng của AI trong các miền bị hạn chế dữ liệu.

Trò trở thành thầy: Hai cái đầu thường tốt hơn một, điều này giờ có thể áp dụng với các đối tượng của AI. Năm 2018, các nhà nghiên cứu của IBM đã đưa ra một khuôn khổ và thuật toán đầu tiên trên thế giới, cho phép các đối tượng AI học cách huấn luyện lẫn nhau và làm việc theo nhóm. Bằng cách trao đổi kiến ​​thức, các đối tượng này có thể học hỏi nhanh hơn nhiều so với các phương pháp trước đó, và trong một số trường hợp chúng có thể học cách phối hợp khi các phương thức hiện tại thất bại.

Hỏi đáp: IBM Research đã cải tiến đáng kể các phương pháp tiếp cận hỏi-đáp (Q-A) theo miền mở, bằng một phương pháp mới cho phép sắp xếp lại trật tự và tổng hợp chứng cứ từ nhiều mẩu thông tin khác nhau nhằm đưa ra các câu trả lời chính xác hơn. IBM đã đạt được những cải tiến đáng kể so với các phương pháp tiên tiến trước đây trên bộ dữ liệu QA miền mở.

Tin tưởng AI

Cuộc chiến để xoá bỏ sự thiên vị: Khi các hệ thống AI ngày càng được sử dụng để hỗ trợ quyết định, chúng cần phải đạt được tính công bằng và không thiên vị. IBM Research đã đưa ra một cách tiếp cận mới để chống lại sự thiên vị, theo đó các dữ liệu đào tạo sẽ được chuyển đổi để giảm thiểu sai lệch, sao cho bất kỳ thuật toán AI nào học được từ nó sẽ tồn tại càng ít sự thiên vị càng tốt. Khi áp dụng thử phương pháp này với hai hệ thống dữ liệu công cộng lớn, IBM Research đã giảm bớt đáng kể những thiên kiến không mong muốn trong khi không làm giảm tính chính xác của hệ thống.

Mở khoá "hộp đen": Các mạng lưới nơ-ron theo chiều sâu (deep neural network) chính là những chiếc "hộp đen" trên nhiều khía cạnh - Ngay cả khi một mạng lưới đã đi đến một quyết định chính xác, thường rất khó để hiểu tại sao quyết định đó được đưa ra. Sự thiếu giải thích vốn có này là một rào cản đối với niềm tin của người dùng vào các hệ thống AI và gây khó khăn cho việc giải thích các cơ chế thất bại có thể xảy ra. Để giải quyết những vấn đề này, các nhà khoa học AI của IBM Research đã phát triển một phương pháp machine learning mới có tên là Profweight. Đây là một mạng sâu, xây dựng một mô hình đơn giản hơn và có thể đạt được hiệu suất tương tự như mạng ban đầu.

Dự đoán các cuộc tấn công bất lợi: Các mô hình machine learning hiện đại nhất có thể đạt được độ chính xác chưa từng có về khả năng dự đoán, nhưng chúng cũng dễ dàng bị lừa bởi các thông tin đầu vào độc hại được thiết kế cẩn thận,có tên là "các ví dụ đối nghịch". Là một bước quan trọng trong công cuộc phòng chống các cuộc tấn công tương tự, IBM Research đã đề xuất một biện pháp mới đã được chứng nhận về sức mạnh, có tên là CLEVER (Cross Lipschitz Extreme Value for nEtwork Robustness - Giá trị cực cao về tính mạnh mẽ của hệ thống xuyên Lipschitz). Biện pháp này có thể được sử dụng để đánh giá sự mạnh mẽ của mạng lưới nơ-ron chống lại sự tấn công. Điểm số CLEVER ước tính "sức mạnh" tấn công tối thiểu cần thiết để một cuộc tấn công thành công trong việc đánh lừa một mô hình mạng sâu nhất định, khiến dễ đánh giá tính bảo mật của các mô hình AI hơn, và đưa ra phương hướng để phát hiện và bảo vệ khỏi các cuộc tấn công trong các hệ thống được áp dụng.

Mở rộng AI 

Độ chính xác 8 bit giúp tăng tốc huấn luyện: Các mô hình deep learning vô cùng mạnh mẽ, nhưng để huấn luyện chúng đòi hỏi nguồn tài nguyên tính toán khổng lồ. Năm nay, các nhà nghiên cứu của IBM lần đầu tiên đã chứng minh khả năng đào tạo các mô hình deep learning chỉ với độ chính xác 8 bit, trong khi vẫn giữ được độ chính xác của mô hình trên tất cả các loại dữ liệu chính, bao gồm hình ảnh, lời nói và văn bản. Những kỹ thuật này tăng tốc thời gian huấn luyện cho các mạng nơ-ron sâu gấp 2-4 lần so với các hệ thống 16 bit ngày nay. Mặc dù trước đây người ta coi là không thể giảm độ bit này được nữa trong huấn luyện, IBM hy vọng nền tảng đào tạo 8 bit sẽ trở thành một tiêu chuẩn công nghiệp được áp dụng rộng rãi trong những năm tới.

Cách tiếp cận mạng nơ-ron mới trên khối: BlockDrop, một cách thức mới để nâng cao tốc độ suy luận trong các mạng nơ-ron rất sâu, học cách chọn lớp hoặc "khối" nào của mạng sâu để bỏ qua, giảm bớt tổng số phép tính toán trong khi vẫn duy trì được độ chính xác. Sử dụng BlockDrop, tốc độ suy luận trung bình đạt được là 20%, và có thể cao tới 36% đối với một số loại thông tin đầu vào, trong khi vẫn duy trì độ chính xác số 1 trên ImageNet.

Thiết kế trong tầm tay: Các nhà nghiên cứu của IBM đã phát triển một kỹ thuật tìm kiếm kiến ​​trúc nơ-ron mới nhằm giảm tải nặng cần thiết để thiết kế một mạng lưới nơ-ron. Phương pháp này xác định các mẫu kiến ​​trúc nơ-ron lặp lại, được gọi là "tế bào nơ-ron" - những tế bào này được cải thiện thông qua một quá trình phát triển. Sự phát triển này có thể thiết kế các kiến trúc nơ-ron đạt được độ chính xác dự đoán tiên tiến nhất trong các nhiệm vụ phân loại hình ảnh, mà không cần sự can thiệp của con người, trong một số trường hợp đạt được tốc độ lên tới 50.000 lần so với các phương pháp tìm kiếm dự trên kiến trúc nơ-ron trước đây.

Ba xu hướng AI trong năm 2019

Mặc dù 2018 là một năm nhiều thành tựu, IBM tin rằng 2019 sẽ là một năm có nhiều tiến bộ hơn nữa trong ngành AI.

Quan hệ nhân quả sẽ ngày càng thay thế các mối tương quan:Ai cũng biết rằng tiếng gà gáy sáng không "khiến cho" mặt trời mọc (mối tương quan), nhưng ngược lại việc bật công tắc sẽ khiến đèn sáng (quan hệ nhân quả). Mặc dù trực giác về tính nhân quả của thế giới là không thể thiếu được trong các hành động và phán quyết hàng ngày của chúng ta, hầu hết các phương pháp AI ngày nay về cơ bản dựa trên mối tương quan và thiếu sự hiểu biết sâu sắc về quan hệ nhân quả. Các phương pháp suy luận nhân-quả mới cho phép chúng ta suy ra các cấu trúc nhân quả từ dữ liệu, nhằm lựa chọn hiệu quả các biện pháp can thiệp để kiểm tra các mối quan hệ nhân quả giả định và đưa ra quyết định tốt hơn dựa trên kiến thức về cấu trúc nhân quả. Năm 2019, hy vọng các kỹ thuật xây dựng mô hình nhân quả sẽ xuất hiện với tư cách là nhân vật trung tâm trong thế giới AI.

AI đáng tin cậy sẽ chiếm vị trí trung tâm: Năm 2018, một số tổ chức đã phản ứng với các vụ vi phạm dữ liệu và mối quan tâm về quyền riêng tư của người tiêu dùng bằng cách thành lập các "ban cố vấn về đạo đức". Năm 2019, chúng ta sẽ bắt đầu thấy những nỗ lực này trở thành trung tâm của việc các công ty xây dựng, huấn luyện và triển khai các công nghệ AI. IBM hy vọng sẽ thấy sự tập trung đặc biệt vào việc chuyển giao những tiến bộ nghiên cứu trong lĩnh vực này sang các sản phẩm và nền tảng thực sự, cùng với việc nhấn mạnh vào việc khuyến khích sự đa dạng và hoà nhập xã hội trong các nhóm kỹ thuật, nhằm đảm bảo nhiều tiếng nói và quan điểm đa dạng trong việc định hướng các tiến bộ về công nghệ.

Lượng tử (quantum) có thể hỗ trợ AI: Năm 2019 chúng ta sẽ thấy lực kéo tăng tốc trong việc thử nghiệm và nghiên cứu lượng tử, và nghiên cứu mới về cách điện toán lượng tử có thể đóng vai trò trong việc huấn luyện và chạy các mô hình AI. Một yếu tố cốt lõi của thuật toán lượng tử là khai thác các không gian trạng thái lượng tử lớn theo cấp số nhân thông qua sự can thiệp có thể kiểm soát được. Khi sự phức tạp của AI tăng lên, điện toán lượng tử - mà hàng ngàn tổ chức đã truy cập thông qua các dịch vụ điện toán đám mây của IBM - có thể có khả năng thay đổi cách chúng ta tiếp cận các nhiệm vụ tính toán của AI.

Phạm Lê