Lê Viết Quốc: Nhà nghiên cứu đứng sau AutoML của Google

Gầy, ít nói và đeo một cặp kính dầy cộp, Lê Viết Quốc khiến bạn không khỏi bất ngờ khi anh chính là một nhân vật quan trọng trong lĩnh vực trí tuệ nhân tạo tại Google. Quốc được biết đến với "Google B
Lê Viết Quốc: Nhà nghiên cứu đứng sau AutoML của Google

Lê Viết Quốc sinh năm 1982 tại một ngôi làng nhỏ ở Hương Thủy (tỉnh Thừa Thiên-Huế), khu vực mà Quốc sinh sống từng không có điện, nhưng anh thường xuyên đến một thư viện gần nhà để nghiên cứu về phát minh thông qua những trang sách và ôm giấc mơ một ngày nào đó sẽ có những phát minh của riêng mình.

Sau khi tốt nghiệp trường chuyên Quốc học Huế, Lê Viết Quốc tiếp tục theo học tại Đại học Quốc gia Australia (Úc) và sau đó làm nghiên cứu sinh Tiến sĩ tại Đại học Stanford (Mỹ) về trí tuệ nhân tạo.

Năm 2011, Quốc đồng sáng lập Google Brain, cùng với cố vấn Tiến sĩ Andrew Ng, nghiên cứu sinh Google Jeff Dean và nhà nghiên cứu tại Google Greg Corrado. Mục tiêu là khai phá về Học sâu (Deep Learning) trên cơ sở khối lượng dữ liệu khổng lồ của Google. Trước đó, Quốc đã thực hiện một vài nghiên cứu ở Đại học Stanford về Học sâu không giám sát (Unsupervised Deep learning).

Deep Learning là một thuật toán dựa trên một số ý tưởng từ não bộ tới việc tiếp thu nhiều tầng biểu đạt, cả cụ thể lẫn trừu tượng, qua đó làm rõ nghĩa của các loại dữ liệu. Deep Learning có thể giúp giải quyết hàng loạt vấn đề như giáo dục, biến đổi khí hậu... Ví dụ, sử dụng các cảm biến từ xa, dữ liệu môi trường trên thế giới sẽ được theo dõi và ghi lại. Hiện khối lượng dữ liệu đó phần lớn chưa được xử lý và Deep Learning có thể được áp dụng để hiểu các chuỗi và chỉ ra hướng giải quyết.

Năm 2012, Quốc công bố một nghiên cứu về Deep Learning. Theo đó, anh đã phát triển một mô hình mạng lưới nơ-ron chuyên sâu có thể nhận ra mèo dựa trên 10 triệu hình ảnh kỹ thuật số từ Youtube, cũng như hơn 3.000 bức ảnh trong tập dữ liệu ImageNet.

Trong khi phương thức Học không giám sát (Unsupervised Learning) sau đó được minh chứng là không thực tế cho việc thương mại hóa – ít nhất là trong thời điểm đó – Quốc trả lời trong một cuộc phỏng vấn với WIRED: "Sẽ là rất tuyệt nếu chúng ta có một thuật toán có thể vừa khám phá nó và vừa học nó cùng một cách, bởi vì trên thực tế là chúng ta có nhiều dữ liệu không được dán nhãn hơn là dữ liệu được dán nhãn".

"Rất ít người thực sự hiểu được vì sao máy móc lại có thể học hỏi và tư duy. Deep Learning (học sâu) vẫn còn là khái niệm rất mới", Quốc trả lời CNN.

Phương pháp Học chuỗi liên tiếp

Sau khi tốt nghiệp vào năm 2013, Quốc chính thức gia nhập Google với tư cách một nhà nghiên cứu. Anh sớm đạt được những đột phá ấn tượng trong lĩnh vực dịch máy (Machine Translation), một trong những lĩnh vực nghiên cứu năng động nhất trong cộng đồng học máy (Machine Learning).

Để đạt được các thành tựu đó, Quốc phải vượt lên những phương pháp học sâu đã hiệu quả với hình ảnh và lời nói – thứ có thể phân tích được với các đầu vào có kích thước cố định.

Vào năm 2014, Quốc đề xuất trình tự chuỗi (Seq2seq) học với nhà nghiên cứu Google Ilya Sutskever và Oriol Vinyals. Nó là một khung công cụ - một thư viện các mã lệnh (framework) giải mã bộ mã hóa có mục đích đào tạo các mô hình để chuyển đổi các chuỗi từ một tên miền này sang miền khác, chẳng hạn như chuyển đổi các câu sang các ngôn ngữ khác nhau.

Seq2seq learning đòi hỏi ít sự lựa chọn trong thiết kế kỹ thuật hơn và cho phép hệ thống dịch của Google hoạt động hiệu quả và chính xác trên các tệp dữ liệu khổng lồ. Nó chủ yếu được sử dụng cho các hệ thống dịch máy và được chứng minh là có thể ứng dụng được ở nhiều mảng hơn, bao gồm tóm tắt văn bản, các cuộc hội thoại với trí tuệ nhân tạo, và trả lời câu hỏi.

Sau đó, Quốc tiếp tục phát minh ra Doc2vec – một thuật toán không giám sát sử dụng cho việc hiển thị các nội dung có độ dài cố định từ các đoạn văn bản có độ dài biến đổi, chẳng hạn như câu, đoạn văn và các tài liệu.

Doc2vec là phần mở rộng của Word2vec, được giới thiệu vào năm 2013 bởi nghiên cứu sinh của Google, Tomas Mikolov. Ý tưởng của nó là mỗi từ có thể được biểu diễn bằng một vec-tơ, có thể được tự động học từ một tập hợp văn bản. Quốc sử dụng vector cho các đoạn văn để mô hình có thể tạo ra sự hiển thị - trình chiếu của tài liệu, bất chấp độ dài của nó.

Những nỗ lực nghiên cứu của Quốc đã được đền đáp. Trong năm 2016, Google đã công bố hệ thống dịch máy Nơ-ron (Neural Machine Translation System), sử dụng trí tuệ nhân tạo AI để tạo ra các bản dịch tốt hơn và tự nhiên hơn.

Vào năm 2015, Quốc đã lọt vào danh sách "Người cải cách dưới 35 tuổi (Innovators Under 35)" của Tạp chí Công nghệ MIT ( MIT Technology Review ) ở hạng mục Visionaries, vì mục tiêu "giúp cho phần mềm đủ thông minh để hỗ trợ mọi người khiến cuộc sống hàng ngày của họ trở nên dễ chịu".

AutoML: Mạng lưới thần kinh học phát triển tự động

Lê Viết Quốc: Nhà nghiên cứu đứng sau AutoML của Google ảnh 3

Đào tạo mạng nơron sâu đòi hỏi một lượng lớn dữ liệu được dán nhãn và thử nghiệm qua lại: Bạn chọn kiến ​​trúc, xây dựng nền móng và điều chỉnh trọng số dựa trên kết quả đầu ra. Đối với những người có chuyên môn học máy hạn chế, quá trình thử nghiệm đã bằng cách nào đó trở nên rất kỹ lưỡng và tốn thời gian.

Vào năm 2016, Quốc và một nhà nghiên cứu khác của Google, Barret Zoph đề xuất hệ thống tìm kiếm kiến ​​trúc Nơ-ron. Họ sử dụng mạng hồi quy để tạo ra các mô tả mô hình của mạng nơron và đào tạo RNN này với việc học tăng cường để tối đa hóa độ chính xác dự kiến ​​của các kiến ​​trúc được tạo ra trên một bộ xác nhận hợp lệ.

Phương thức mới này có thể giúp các nhà nghiên cứu thiết kế một kiến ​​trúc mạng phù hợp với cấu trúc nhân tạo chính xác nhất, thiết lập thử nghiệm trên tập dữ liệu CIFA-10. Một năm sau, Quốc và Zoph nâng tầm nghiên cứu của họ bằng việc đề xuất NASNet-A, một cấu ​​trúc có thể chuyển đổi cho các tập dữ liệu hình ảnh có quy mô lớn.

Nghiên cứu của Quốc đặt nền móng cho AutoML, một bộ sản phẩm của Google được thiết kế cho các nhà phát triển có chuyên môn về machine learning và tài nguyên hạn chế. Google đã ra mắt AutoML Vision vào đầu năm nay. Tháng trước tại hội nghị Cloud Next của Google, công ty đã phát hành các công cụ dịch thuật và ngôn ngữ tự nhiên.

Trong 6 năm qua, Quốc đã dẫn đầu trong phát triển Deep Learning. Nhà nghiên nghiên cứu 36 tuổi của Google hiện sẵn sàng để nâng Deep Learning lên một tầm cao hơn.

Nhiều người rất háo hức muốn biết quan điểm ​​của Quốc về tương lai của những cỗ máy học cách tự phát triển. Liệu cuối cùng máy móc sẽ thay thế các nhà khoa học dữ liệu? Đây là một câu hỏi còn đang để ngỏ.

"Tôi mong muốn tạo ra được một cỗ máy có thể nhìn, nghe và hiểu được chúng ta", Quốc nói, nhưng cũng thừa nhận rằng điều đó còn lâu nữa mới xảy ra.

Theo Trí thức trẻ

Có thể bạn quan tâm

Giá dầu ô liu dự kiến hạ nhiệt sau mốc đỉnh lịch sử

Giá dầu ô liu dự kiến hạ nhiệt sau mốc đỉnh lịch sử

Giá dầu ô liu toàn cầu đang dần hạ nhiệt khi sản lượng được kỳ vọng sẽ tăng mạnh trong mùa vụ 2024-2025. Tuy nhiên, ngành công nghiệp này vẫn đối mặt với vô số thách thức lớn từ biến đổi khí hậu, vì vậy cần có sự chuyển đổi sâu rộng để đảm bảo tăng trưởng bền vững…

Những nhân vật chủ chốt trong chính quyền Trump 2.0

Những nhân vật chủ chốt trong chính quyền Trump 2.0

Tổng thống đắc cử Donald Trump đang khẩn trương chuẩn bị đội ngũ nội các và nhân sự cấp cao cho nhiệm kỳ thứ hai tại Nhà Trắng. Những lựa chọn này hứa hẹn sẽ giúp định hình chiến lược lãnh đạo mới của ông trong bốn năm tới…

Top 10 quốc gia giàu có nhất thế giới năm 2024

Top 10 quốc gia giàu có nhất thế giới năm 2024

Những quốc gia giàu có nhất thế giới không chỉ được định hình bởi nguồn tài nguyên thiên nhiên dồi dào hay quy mô dân số nhỏ, mà còn bởi các chính sách tài chính thông minh và khả năng duy trì sự thịnh vượng trong bối cảnh kinh tế toàn cầu biến động…

Kế hoạch chuyển giao quyền lực tại đế chế xa xỉ Prada

Kế hoạch chuyển giao quyền lực tại đế chế xa xỉ Prada

Miuccia Prada và Patrizio Bertelli đều đang chủ động chuẩn bị chuyển giao quyền lực tại "đế chế" Prada cho thế hệ tiếp nối. Điều này không chỉ giúp bảo vệ di sản của gia đình mà còn đảm bảo quá trình kế thừa diễn ra suôn sẻ, tránh những xung đột hay căng thẳng không đáng có…

Hơn 2,8 tỷ USD đặt cược cho khả năng Bitcoin chạm mốc 90.000 USD

Hơn 2,8 tỷ USD đặt cược cho khả năng Bitcoin chạm mốc 90.000 USD

Giá Bitcoin đã đạt mức kỷ lục 81.000 USD, với các chỉ báo phái sinh cho thấy đà tăng mạnh mẽ sẽ còn tiếp tục. Tâm lý lạc quan được thúc đẩy bởi chiến thắng của ông Donald Trump và các quyết định cắt giảm lãi suất của Cục Dự trữ Liên bang Mỹ (Fed)…

Tổng thống Mỹ Joe Biden công bố thỏa thuận sơ bộ với Intel trong chuyến thăm khuôn viên Intel Ocotillo tại Arizona hồi tháng 3

Chính quyền Biden và ngành chip đẩy nhanh tiến trình nhận hỗ trợ trước khi ông Donald Trump nhậm chức

Chính quyền Tổng thống Joe Biden đang “chạy đua” để hoàn tất các thỏa thuận hỗ trợ ngành chip trước khi ông Donald Trump nhậm chức. Việc này càng cấp bách hơn khi nhiều công ty hàng đầu như Intel và Samsung vẫn đang trong giai đoạn đàm phán để nhận trợ cấp trị giá hàng tỷ USD từ chính phủ Mỹ…

Thế giới nên đối diện với "Trump 2.0" theo cách nào?

Thế giới nên đối diện với "Trump 2.0" theo cách nào?

Trong cả cuộc marathon bầu cử Tổng thống Mỹ, đã có rất nhiều ý kiến trái chiều, thậm chí là lo ngại về khả năng trở lại chiếc ghế quyền lực của một trong những nhà lãnh đạo khó đoán định nhất: "Trump 2.0".

"Trump 2.0" sẽ thay đổi nước Mỹ như thế nào?

"Trump 2.0" sẽ thay đổi nước Mỹ như thế nào?

Tính tới 11h30 ngày 6/11, ông Trump đang dẫn trước bà Harris với những phiếu đã kiểm, Đảng Cộng hòa của ông Trump cũng gần như chắc chắn giành thắng lợi tại cả Thượng viện và Hạ viện Mỹ. Câu hỏi hiện tại là Trump 2.0 sẽ như thế nào?