9x và Hệ thống biến báo điện tử thành báo nói

07:08, 20/11/2012
|

(VnMedia) - Một trong hai giải Nhì, cũng là giải thưởng cao nhất Nhân Tài Đất Việt 2012 lĩnh vực sản phẩm CNTT triển vọng đã thuộc về “Hệ thống biến báo điện tử thành báo nói ViNas” của nhóm tác giả đến từ Công ty TNHH giải pháp sáng tạo và nghiên cứu tiên tiến iSolar. Ngay sau khi nhóm tác giả được nhận giải, phóng viên báo điện tử VnMedia đã có buổi trao đổi với anh Đinh Anh Tuấn, trưởng nhóm.

Trước hết xin chúc mừng, chia vui với anh và nhóm tác giả đã đạt giải cao nhất NTĐV 2012 trong nhóm sản phẩm CNTT triển vọng. Xin anh cho biết cảm xúc hiện tại của mình khi nhận giải thưởng NTĐV?

Khi phát triển sản phẩm này, các bạn trong nhóm và cả tôi đều cố gắng hết sức và mong muốn đạt giải tại NTĐV 2012. Nhưng lọt vào vòng Chung khảo đã là rất tốt rồi vì như thế đã vượt lên được chính mình. Theo tôi việc lọt vào Top 3 của Giải thưởng là rất khó khăn. Nhưng khi đọc đến tên nhóm giành giải Nhì NTĐV, cả nhóm đều rất  ngạc nhiên và vui mừng. Tôi cảm thấy rất vinh dự và tự hào vì đã đưa công nghệ của một viện CNTT là công nghệ xử lý tiếng nói hướng tới việc giúp con người và máy móc giao tiếp trở nên gần gũi hơn bằng tiếng nói. Chúng tôi đưa được sản phẩm như thế vào thực tế cuộc sống và được công nhận là điều rất tự hào.

Ảnh minh họa

Nhóm tác giả Hệ thống biến báo điện tử thành báo nói ViNAS nhận giải Nhì NTĐV 2012 trong lĩnh vực sản phẩm CNTT triển vọng.


Xin anh cho biết từ đâu mà nhóm có ý nghĩ biến báo điện tử thành báo nói?

Thực ra tư tưởng về sản phẩm này với tiếng Anh có rồi, chúng tôi không phải tiên phong đầu tiên, chúng tôi chỉ mong muốn tiếng Việt cũng được ngang bằng với ngôn ngữ khác về mặt khoa học và công nghệ. Vì mình là người Việt nên chỉ có người Việt mới làm tốt được cho tiếng Việt.

Xin anh cho biết, trong quá trình hoàn thành sản phẩm, cả nhóm đã gặp phải những khó khăn và trở ngại nào để cho ra đời một sản phẩm hoàn chỉnh như ngày hôm nay?

Khó khăn thì tương đối nhiều, bởi vì bọn tôi đều còn rất trẻ, đều sinh năm 1989, 1990 vừa làm vừa học, hơn nữa hệ thống này tự thiết kế và cài đặt ra nên nhiều lúc không biết là mình đã làm đúng chưa, đã phục vụ đúng chưa, đôi khi phải “đập” đi làm lại rất nhiều lần. Bọn tôi bắt đầu từ việc đưa một công nghệ vào đời sống và thú thực là có thiếu bước nghiên cứu thị trường nên nhiều lúc tự hỏi sản phẩm đưa ra có được người dùng đáp ứng không, có phù hợp với người dùng không. Điều đó toàn phải tự trả lời nên sắp tới nhóm mong muốn đưa sản phẩm vào thực tế, không chỉ còn là một công nghệ nằm trong phòng thí nghiệm nữa, một công nghệ mới gần gũi với người dùng và được người dùng đón nhận, đóng góp.

Vậy để đưa sản phẩm vào cuộc sống, nhóm có kế hoạch sẽ thực hiện như thế nào?

Ảnh minh họa

Trưởng nhóm Đinh Anh Tuấn

Điều đầu tiên là chúng tôi sẽ bắt đầu tìm hiểu thị trường. May mắn là trước đó tôi cũng  tìm được một báo cáo thống kê các thói quen sử dụng Internet của tổ chức Cimigo làm từ năm 2011. Theo đó, 94% số người được hỏi họ đều lên mạng Internet tìm hiểu thông tin, trên báo điện tử, thống kê tờ báo nào được nhiều người dùng vào đọc nhất. Nhờ thế, bọn mình có niềm tin để làm việc với một tờ báo đó.

Thực sự sản phẩm này mới chỉ ở mức thử nghiệm với ít người dùng nên khi triển khai với số lượng lớn người dùng, còn rất nhiều việc phải thay đổi và cải tiến.

Tiếp theo chúng tôi sẽ phải cải tiến server để phục vụ số lượng người dùng lớn, máy chủ lớn, thực sự công nghệ tiếng nói đang nhận được nhận xét không hay lắm, ví dụ như giọng nói không thật, mọi người nghe có vẻ không hiểu lắm nên cần cải tiến để đưa giọng nói hay hơn, nhiều lựa chọn giọng nữa.

Khi tham gia phản biện trước hội đồng BGK giải thưởng NTĐT, các thầy cũng có rất nhiều góp ý bổ ích, giúp mình rất nhiều trong việc cải tiến sản phẩm này, hướng tới người dùng nhiều hơn và có thể hợp tác với các công ty sử dụng công cụ tương tự. Chẳng hạn như trong miền Nam cũng nghiên cứu công nghệ tiếng nói như tiếng nói Phương Nam, Hoa súng của miền bắc…

Nếu so với các sản phẩm khác trên thị trường trong nước và trên thế giới, sản phẩm của mình có những điểm nào nổi bật?

Thực ra cùng là công nghệ xử lý tiếng nói nên cùng gặp khó khăn như nhau, không có ai vượt trội hơn, mong muốn chỉ là có được nền tảng đó từ rất lâu rồi, sau này sẽ truyền lại cho những người tiếp theo để kế thừa và phát huy cho tiếng Việt thực sự được tổng hợp, tạo ra được tiếng Việt nhân tạo tốt cho người dùng Việt, gần với con người nhất. Người nước ngoài làm rất tốt nhưng không hiểu sao người Việt vẫn khó trong việc chia sẻ.

Cũng có công ty nước ngoài đã thực hiện công nghệ này trên iPhone hay Android. Đó là “gã khổng lồ” Dragon với phần mềm Dragon Dictation - nhận dạng và tổng hợp tiếng Việt rất tốt.

Vậy nhóm có ý định phát triển sản phẩm để cạnh tranh với Dragon Dictation không?

Thực ra học hỏi thì đúng hơn vì họ có một lực lượng lớn và đầu tư từ rất lâu, sản phẩm của họ đã đi vào thương mại hóa rồi. Mình vẫn bị giới hạn ở một viện nghiên cứu và không phải lúc nào nhân lực cũng ổn định cũng như không phải lúc nào dự án cũng được triển khai một cách trơn tru, có biến động nhân sự như có người tách ra đi du học, đào tạo nâng cao, mất mát thành viên nên vị trí đó bị khuyết.

Vậy xin anh cho biết mong muốn của nhóm lúc này là gì?

Nhóm sẽ cố gắng duy trì tiếp để đưa sản phẩm gần gũi với người dùng Việt hơn nữa, để có thể tạo được tiếng Việt nhân tạo tốt cho người dùng Việt.

Xin cảm ơn anh và một lần nữa chúc mừng thành công của “Hệ thống biến báo điện tử thành báo nói ViNas” đã đạt được!


Tuệ Minh

Ý kiến bạn đọc