TS Ha Jung Woo, Giám đốc NAVER Clova AI Labs, đơn vị chịu trách nhiệm về các hoạt động hợp tác và nghiên cứu của dự án, lý giải vì sao Dự án chọn hai trường đại học Việt Nam làm đối tác và chia sẻ tầm nhìn về các công nghệ AI của tương lai.
Xin ông cho biết, Dự án Global AI R&D Belt ra đời trong bối cảnh nào và nhằm mục đích gì?
Lĩnh vực AI trở nên cạnh tranh khốc liệt hơn kể từ khi AlphaGo [chương trình máy tính chơi cờ vây do DeepMind phát triển] xuất hiện vào năm 2016. Không còn ranh giới quốc gia trong cuộc cạnh tranh giữa các công nghệ AI. Đặc biệt, NAVER phải cạnh tranh với các công ty công nghệ toàn cầu như Google, MS, Meta (Facebook), Amazon, Baidu và Alibaba. Để nâng cao năng lực cạnh tranh toàn cầu, năm 2018, chúng tôi quyết định xây dựng một mạng lưới hợp tác nghiên cứu và phát triển AI mạnh mẽ trên khắp Hàn Quốc, Nhật Bản, châu Âu và Đông Nam Á vào năm 2018. Điều này có nghĩa là chúng tôi có thể cạnh tranh với các đối thủ lớn ở Mỹ và Trung Quốc bằng cách thiết lập một vành đai R&D kết nối châu Á và châu Âu. Bên ngoài Hàn Quốc, chúng tôi đã có các chi nhánh nghiên cứu và phát triển AI ở Pháp, Nhật Bản, và Việt Nam; giờ đây, chúng tôi đang mở rộng Vành đai sang Mỹ, Canada và Đức.
Ông có thể giải thích vì sao Dự án chọn hợp tác với nhiều phòng thí nghiệm/trường đại học ở các nước như University Grenoble Alpes (Pháp), Đại học Tübingen (Đức), Đại học Bách khoa Hà Nội và Học viện Công nghệ Bưu chính Viễn thông ở Việt Nam...
Bốn thành phần chính của nghiên cứu và phát triển AI là chuyên gia, dữ liệu, cơ sở hạ tầng và thị trường kinh doanh. Bằng cách hợp tác với các phòng thí nghiệm/trường đại học khác nhau, chúng tôi có thể đảm bảo thu hút và quy tụ được nhiều tài năng AI xuất sắc trên toàn cầu. Ngoài ra, thông qua dự án này, chúng tôi có thể xây dựng dữ liệu địa phương và toàn cầu với quy mô lớn để đào tạo các mô hình AI.
Bên cạnh việc tạo ra các mô hình AI cạnh tranh, cũng cần phải hiểu các nền văn hóa và thị trường địa phương để kinh doanh thành công. Dự án Global AI R&D Belt đã góp phần phát triển các dịch vụ sử dụng AI của NAVER trên toàn cầu. Mặt khác, các đối tác hợp tác nghiên cứu của chúng tôi sẽ có thêm nhiều kinh nghiệm giải quyết các nhiệm vụ AI đa dạng và đầy thách thức trong thế giới thực.
Dự án đặc biệt quan tâm đến những công nghệ AI nào?
Phạm vi hợp tác của dự án Global AI R&D Belt là khá rộng. Trong hợp tác với các đối tác châu Âu, chúng tôi mong muốn tạo ra các công nghệ AI có tầm ảnh hưởng về lâu dài, ví dụ như AI Robotics [robot sử dụng công nghệ AI] và Trustworthy AI [AI dựa trên dữ liệu đáng tin cậy, được bảo mật, và không chỉ đưa ra kết quả cuối cùng mà còn đưa ra các thông tin bằng chứng để giải thích kết quả].
Việc xây dựng dữ liệu cho AI rất quan trọng. Ví dụ, NAVER muốn tạo ra các mô hình tổng hợp giọng nói và nhận dạng giọng nói cho các dịch vụ AI của Nhật Bản và Việt Nam. Chúng tôi có thể đạt được những mục tiêu này một cách hiệu quả hơn nhiều bằng cách xây dựng dữ liệu giọng nói, xác thực các mô hình AI thông qua sự hợp tác toàn cầu chặt chẽ. Nhận dạng hình ảnh hoặc video - bao gồm nhận dạng ký tự quang học OCR - là những công nghệ AI quan trọng đối với doanh nghiệp. Dự án Global AI R&D Belt có thể nâng cao khả năng cạnh tranh của chúng tôi trong một loạt các công nghệ AI như kể trên.
Tôi muốn nói thêm rằng, từ khóa của các xu hướng công nghệ AI gần đây là “large-scale”[quy mô lớn] hoặc hyperscale [siêu quy mô]. Kể từ khi phòng thí nghiệm trí tuệ nhân tạo OpenAI [do Elon Musk và Sam Altman sáng lập] cho ra đời [mô hình dự đoán ngôn ngữ thế hệ thứ ba] GPT-3 vào năm 2020, nhiều ông lớn về AI trên thế giới đã tập trung vào các siêu AI có thể cung cấp các chức năng sáng tạo mới mà AI trước đây không thể thực hiện, ví dụ như tạo ra các đoạn văn bản trong các ngữ cảnh theo yêu cầu chỉ với một số ít dữ liệu mẫu.
Các nhóm nghiên cứu ở các nước kết nối với nhau ra sao trong dự án Global AI R&D Belt? Hiệu quả hợp tác của họ như thế nào?
Trước đây, các dự án hợp tác toàn cầu của NAVER hướng đến những mục đích khác nhau, tùy thuộc vào đối tác mà chúng tôi làm việc cùng, nên không có nhiều dịp để toàn bộ các nhóm nghiên cứu chung tay phát triển một công nghệ. Tuy nghiên, kể từ khi Open AI giới thiệu GPT-3 vào năm 2020 và mô hình “siêu AI” có khả năng tạo ra các đoạn văn bản hoàn chỉnh dựa trên dữ liệu đầu vào hạn hẹp này trở thành điểm cốt lõi của công nghệ trí tuệ nhân tạo thì tình hình đã phần nào thay đổi.
NAVER bắt tay chế tạo siêu AI của mình vào tháng 10/2020 và chính thức ra mắt nền tảng HyperCLOVA vào tháng 5/2021. Đây là mô hình [lập trình ngôn ngữ tư duy] NLP quy mô cực lớn tập trung vào tiếng Hàn và tiếng Nhật, có khả năng tự động sửa lỗi chính tả và đề xuất các tìm kiếm liên quan. Hiện tại, mô hình này đã được áp dụng cho các dịch vụ AI khác nhau tại Hàn Quốc và Nhật Bản. Tuy nhiên, chúng tôi có kế hoạch mở rộng thêm tiếng Anh và tiếng Trung cũng như các ngôn ngữ khác ở khu vực Đông Á để đưa các dịch vụ “siêu AI” ra toàn cầu. Dự án này sẽ cần đến sự tham gia của tất cả các nhóm nghiên cứu thuộc dự án Global R&D AI Belt.
CLOVA - đơn vị chủ lực về nghiên cứu AI của NAVER, đồng thời đóng vai trò điều phối dự án Global AI R&D Belt - đang tích cực đẩy mạnh việc trao đổi và cộng tác giữa các nhóm nghiên cứu. Ngoài ra, để chuyển giao công nghệ và mở rộng quy mô, các chuyên gia AI hàng đầu thế giới thuộc NAVER Labs Europe, một chi nhánh của Dự án ở châu Âu, cũng đã thực hiện nhiều hội thảo, khóa học chuyên sâu về AI. Các khóa học này từng thực hiện thành công tại Đại học Bách khoa Hà Nội.
Việt Nam chưa phải là nước phát triển về KH&CN, vậy Global R&D AI Belt nhìn thấy tiềm năng gì ở các trường đại học Việt Nam để quyết định chọn họ làm đối tác?
Dù Việt Nam có thể chưa được coi là một trong những quốc gia dẫn đầu thế giới về KH&CN, song Việt Nam vô cùng nổi trội trong lĩnh vực khoa học máy tính (computer science), đồng thời sở hữu nguồn nhân lực IT trẻ đầy tiềm năng. Không chỉ vậy, có rất nhiều nhà nghiên cứu người Việt đang làm việc và cho ra những kết quả nghiên cứu mang tính đột phá tại các tập đoàn công nghệ lớn hàng đầu thế giới như Google, Ndivia,… Trên phương diện hợp tác và phát triển, yếu tố con người, cụ thể là nhân tài IT, là một yếu tố vô cùng quan trọng và thu hút. Đặc biệt, tôi được biết Đại học Bách khoa Hà Nội và Học viện Công nghệ Bưu chính Viễn thông là hai trường hàng đầu Việt Nam trong lĩnh vực công nghệ thông tin. Quyết tâm mạnh mẽ và mong muốn thúc đẩy phát triển lĩnh vực công nghệ AI của Chính phủ Việt Nam cũng là một yếu tố rất quan trọng đối với chúng tôi. Với những yếu tố trên, chúng tôi đã tiến hành hợp tác với hai trường đại học tiêu biểu của Việt Nam và thu về nhiều thành quả đáng kinh ngạc trên mức kỳ vọng ban đầu của chúng tôi. Hiện tại, chúng tôi đang tích cực xem xét về việc mở rộng quy mô hợp tác tại Việt Nam.
Ông có thể nêu vài kết quả trong hợp tác với hai trường đại học Việt Nam cũng như với các đối tác khác trên thế giới của Dự án?
Một trong những ví dụ về sự thành công có thể kể đến là chúng tôi cùng hai trường đại học xây dựng cơ sở dữ liệu chất lượng và tạo ra mô hình AI liên quan đến nhiều lĩnh vực như công nghệ lái xe tự động (autonomous driving); nhận diện cử chỉ tay và con người; xử lý ngôn ngữ tự nhiên; công nghệ hình ảnh; nhận dạng giọng nói,... Đặc biệt, công trình nghiên cứu về tìm từ đồng nghĩa/gần nghĩa (synonym extraction) trong môi trường văn bản mà chúng tôi triển khai với Đại học Bách khoa Hà Nội đã mang về thành công đáng tự hào khi được công bố tại EMNLP 2021 – hội nghị lớn nhất thế giới về lĩnh vực Xử lý Ngôn ngữ tự nhiên.
Trong hợp tác giữa Hàn Quốc và Nhật Bản, NAVER cũng đang thu về nguồn lợi nhuận lớn khi phát triển các dịch vụ ứng dụng công nghệ AI như trợ lý ảo nghe hộ điện thoại, nhận dạng ký tự quang học OCR,… tại xứ mặt trời mọc.
Về lĩnh vực học thuật, đội ngũ chuyên gia của NAVER tại Hàn Quốc chúng tôi liên tục hợp tác nghiên cứu với NAVER Labs Europe. Thành quả của sự tìm tòi và nghiên cứu không ngừng nghỉ này không chỉ dừng lại ở việc công trình nghiên cứu của chúng tôi được công bố tại Hội nghị Nhận dạng Hình ảnh và Thị giác Máy tính (CVPR) 2021 – sự kiện hàng đầu thế giới về lĩnh vực Thị giác Máy tính, chúng tôi còn tổ chức một workshop riêng có chủ đề liên quan đến nhận diện hình ảnh mang tên “Workshop on ImageNet past, present, and future“ tại NeurIPS 2021. Dù tổ chức online, workshop này của chúng tôi đã kết thúc vô cùng thành công khi có sự tham gia thuyết trình của 13 chuyên gia hàng đầu thế giới và thu hút được hơn 400 chuyên gia trên toàn cầu tham dự.
Cảm ơn ông đã chia sẻ thông tin về Dự án. Chúc cho Dự án sẽ có thêm nhiều tin vui trong năm mới.
Việt Nam vô cùng nổi trội trong lĩnh vực khoa học máy tính (computer science), đồng thời sở hữu nguồn nhân lực IT trẻ đầy tiềm năng. Không chỉ vậy, có rất nhiều nhà nghiên cứu người Việt đang làm việc và cho ra những kết quả nghiên cứu mang tính đột phá tại các tập đoàn công nghệ lớn hàng đầu thế giới như Google, Ndivia,… TS. Ha Jung Woo Giám đốc NAVER Clova AI Labs. |