Chúng ta còn cách xa trí tuệ nhân tạo nói chung đến mức nào

Ngày nay, Trí tuệ nhân tạo tổng quát (AGI) đã trở thành từ khóa trọng tâm trong cả cộng đồng khoa học và công nghiệp. Chỉ vài năm trước, nhiều người tin rằng việc đạt được AGI sẽ mất ít nhất 10 đến 50 năm, hoặc thậm chí nghĩ rằng điều đó là không thể. Ngày nay, những quan điểm bi quan như vậy rất hiếm. Tuy nhiên, so với sự phấn khích của công chúng về làn sóng thay đổi công nghệ này, nhiều học giả tuyến đầu và những người dẫn đầu ngành trong lĩnh vực AI tin rằng vẫn còn một chặng đường dài để AI hiện tại phát triển thành AGI.

Theo Qi Yuan, một giáo sư danh dự tại Đại học Fudan, giám đốc Viện nghiên cứu trí tuệ nhân tạo Thượng Hải (SAIRI) và là người sáng lập công ty Mô hình lớn đáng tin cậy "Infinite Lightyear", "Một trong những biểu hiện cao nhất của AGI là khám phá ra những quy luật chưa biết trong thế giới phức tạp. Nói một cách đơn giản, nó phải là một 'Einstein AI'. Điều này đòi hỏi chúng ta phải tạo ra các mô hình lớn đáng tin cậy 'hộp xám' kết hợp các dự đoán xác suất 'hộp đen' với lý luận logic 'hộp trắng'; và thúc đẩy nghiên cứu cơ bản, bồi dưỡng tài năng và các ứng dụng thực tế thông qua sự tích hợp sâu sắc giữa công nghệ và công nghiệp, từ đó xây dựng một hệ sinh thái đổi mới cho trí tuệ khoa học."

Tại Hội nghị Trí tuệ nhân tạo thế giới (WAIC) 2024 gần đây và Hội nghị cấp cao về Quản trị trí tuệ nhân tạo toàn cầu, SAIRI đã tổ chức thành công một diễn đàn chuyên đề có tên "Trí tuệ nhân tạo: Chuyển đổi mô hình trong nghiên cứu khoa học và phát triển công nghiệp". Đây là lần đầu tiên tổ chức nghiên cứu mới này xuất hiện tại WAIC. SAIRI có thể được coi là mô hình cho việc khám phá hệ sinh thái trí tuệ khoa học "1+1+N" do Thượng Hải thúc đẩy đổi mới. Mô hình này liên quan đến SAIRI với tư cách là trung tâm chịu trách nhiệm về lập kế hoạch chiến lược tổng thể, tích hợp nguồn lực và nghiên cứu công nghệ và đổi mới quan trọng, hợp tác với một trường Đại học Fudan "1" khác và một số trường đại học "N", viện nghiên cứu, công ty công nghệ, nhóm đổi mới và tổ chức đầu tư, để cùng nhau thúc đẩy nghiên cứu khoa học, bồi dưỡng nhân tài, chuyển giao công nghệ và đổi mới và nâng cấp công nghiệp.

Tiêu chuẩn cho AGI phải là tạo ra một "Einstein AI".

Theo quan điểm kỹ thuật, các mô hình ngày càng lớn hơn với nhiều tham số hơn có dẫn đến AGI không? Cho đến nay, xét theo góc độ công nghệ AI cũng như góc độ tiêu thụ năng lượng, các mô hình lớn dựa trên kiến trúc hồi quy tự động Transformer đều không đủ để dẫn đến AGI. AI cần phát triển các mô hình lớn đáng tin cậy "hộp xám" mới. Kết luận này dựa trên nhiều năm kinh nghiệm thực tế của Qi Yuan trong cả học viện và công nghiệp.

Mười năm trước, với ý tưởng "làm cho AI hữu ích", Qi Yuan đã lãnh đạo một nhóm để tăng hệ thống máy học cốt lõi của Alibaba từ 2 triệu tham số lên hàng trăm triệu tham số lần đầu tiên, đạt được sự cải thiện đáng kể về hiệu suất kinh doanh và chứng minh sự chuyển đổi tích hợp của dữ liệu, thuật toán và khả năng kỹ thuật. Đây chính xác là biểu hiện của Luật mở rộng quy mô, được thảo luận rộng rãi trong cộng đồng AI ngày nay.

Qi Yuan nhớ lại rằng nhóm thực sự đã nếm trải được vị ngọt của Luật mở rộng quy mô: sau khi tăng các tham số mô hình lên gấp trăm lần, hiệu ứng tổng thể đã cải thiện đáng kể. "Nhưng bây giờ tôi nghĩ: tại sao chúng ta không làm cho các mô hình AI lớn hơn nữa vào thời điểm đó? Tại sao chúng ta lại dừng lại khi chúng ta có thể tiến xa hơn một bước?" ông nói. "Ngay cả hàng tỷ tham số trong các mô hình lớn cũng không đủ; chúng ta cần tiến tới hàng trăm tỷ, hàng nghìn tỷ hoặc thậm chí nhiều hơn nữa. Vào thời điểm đó, cả học viện và ngành công nghiệp đều thiếu sức mạnh tính toán, và ngay cả trong lĩnh vực công nghiệp, việc đạt được sức mạnh tính toán cao như vậy đòi hỏi chi phí rất cao, chưa kể đến học viện."

Lý do tại sao tiêu chuẩn cho AGI nên là tạo ra một "AI Einstein", Qi Yuan giải thích, là vì nó cần phải vừa hiệu quả vừa thông minh. Đầu tiên, Einstein đã khám phá ra "những đám mây của vật lý đầu thế kỷ 20" thông qua một vài điểm dữ liệu quan trọng. AGI cũng phải có khả năng khám phá và hiểu được những định luật chưa biết của thế giới phức tạp. Tuy nhiên, các mô hình lớn hiện tại không thể đạt được điều này. Ví dụ, mặc dù mô hình lớn trực quan SORA mô phỏng thế giới vật lý ở mức độ chưa từng có, nhưng nó vẫn xây dựng thế giới ba chiều dựa trên mô phỏng của thế giới hai chiều và còn lâu mới hiểu được thế giới vật lý một cách toàn diện. Thứ hai, có vấn đề về mức tiêu thụ điện năng. Bộ não con người hoạt động ở mức khoảng 15 watt, trong khi một GPU đơn lẻ có thể đạt đỉnh ở mức vài trăm watt, chưa kể đến các cụm hàng nghìn hoặc hàng chục nghìn GPU cần thiết để đào tạo các mô hình lớn nói chung. Hiện tại, nếu chúng ta tiếp tục sử dụng các kiến trúc hiện có, mức tiêu thụ điện năng cần thiết sẽ là thiên văn, khiến mục tiêu hiệu quả và thông minh trở nên khó khăn.

"AI Einstein" cũng là một mục tiêu chính của AI for Science (AI4S). Trí thông minh khoa học đã đóng một vai trò quan trọng trong việc đẩy nhanh quá trình giải các phương trình vật lý đã biết, nhưng nó cũng cần kết hợp các quy tắc đã biết với dữ liệu để giảm sự phụ thuộc nghiêm trọng vào dữ liệu và sức mạnh tính toán, cải thiện độ chính xác của lý luận và dự đoán, và đề xuất các lý thuyết khoa học mới dựa trên các quy tắc kiến thức được điều chỉnh theo dữ liệu. Điều này phù hợp với mục tiêu dài hạn của Qi Yuan tại Đại học Fudan và SAIRI - sử dụng trí tuệ nhân tạo để hiểu thế giới phức tạp và khám phá các quy luật chưa biết.

"Hộp xám" là mô hình miền dọc đáng tin cậy, quy mô lớn hỗ trợ nhiều ngành công nghiệp khác nhau.

Những vấn đề nào cần được giải quyết để các mô hình lớn trở thành lực lượng sản xuất mới từ các công cụ AI? Theo Qi Yuan, ngành công nghiệp mô hình lớn phải đối mặt với nhiều thách thức chung, khiến công nghệ, sản phẩm và nhu cầu thị trường khó có thể thống nhất.

"Vấn đề lớn nhất với việc triển khai mô hình lớn ngày nay là thoạt nhìn có vẻ hữu ích nhưng lại không hiệu quả khi sử dụng thực tế", Qi Yuan giải thích. Các mô hình ngôn ngữ lớn ngày nay chủ yếu dự đoán từ tiếp theo dựa trên nhiều từ trước đó, nhưng cách tiếp cận này không phù hợp với lý luận nhiều bước nghiêm ngặt. "Ngôn ngữ là công cụ để giao tiếp, không phải để suy nghĩ". Gần đây, một bài báo được các tổ chức bao gồm MIT công bố trên tạp chí học thuật hàng đầuThiên nhiênchỉ ra rằng ngôn ngữ là một công cụ mạnh mẽ để truyền tải kiến thức văn hóa và nó có thể đã cùng tiến hóa với khả năng suy nghĩ và lý luận của chúng ta, phản ánh sự phức tạp của nhận thức con người. Tuy nhiên, ngôn ngữ không tạo ra sự phức tạp của lý luận.

Để giải quyết tình trạng không đáng tin cậy, khả năng diễn giải thấp và chi phí cao của các mô hình lớn hiện có, một giải pháp hiệu quả là kết hợp lý luận mạng nơ-ron xác suất với tính toán biểu tượng logic, tương tự như sự kết hợp giữa tư duy nhanh dựa trên bản năng và tư duy chậm dựa trên lý luận logic được mô tả trong cuốn sách của người đoạt giải Nobel Daniel KahnemanSuy nghĩ, Nhanh và Chậm. "Đây có thể được gọi là mô hình lớn 'hộp xám'", Qi Yuan tin tưởng. Kết hợp tính toán biểu tượng với mạng nơ-ron trong mô hình lớn đáng tin cậy "hộp xám" có thể giảm "ảo giác" của AI và giải quyết các vấn đề chuyên môn trong các lĩnh vực dọc, do đó trao quyền cho nhiều ngành công nghiệp khác nhau và giải phóng năng suất của các mô hình lớn.

Mô hình lớn đáng tin cậy "hộp xám" là gì? "Ban đầu, học sâu được coi là 'hộp đen'. Bây giờ, bằng cách kết hợp lý luận logic với học sâu, chúng ta có một 'hộp xám'", Qi Yuan giải thích. "'Hộp đen' ban đầu khiến mọi người không biết về quá trình dữ liệu tạo ra kết quả, trong khi mô hình lớn 'hộp xám', được hỗ trợ bởi lý luận logic, cho phép mọi người 'biết cả kết quả và lý do đằng sau chúng'. Theo góc nhìn khác, các mô hình lớn 'hộp xám' có thể sử dụng học sâu để giảm các quy tắc không phù hợp với dữ liệu quan sát được trong thế giới thực".

Qi Yuan cho rằng để AI đóng vai trò cốt lõi trong các kịch bản phức tạp trên nhiều ngành công nghiệp khác nhau - dù là trong lĩnh vực tài chính và bảo hiểm, năng lượng gió và năng lượng, hay vận tải biển và dược phẩm - thì cần phải kết hợp kiến thức ngành có hệ thống, logic lý luận và cơ chế ra quyết định với các mô hình lớn. Mô hình lớn "hộp xám" không chỉ là hướng đi cho AGI mà còn là một công cụ mạnh mẽ để thâm nhập sâu vào các lĩnh vực theo chiều dọc và thực sự giải quyết các vấn đề trong thế giới thực. "Theo quan điểm công nghiệp, sự hiểu biết này rất trực quan", Qi Yuan minh họa. Bác sĩ không cần phải trở thành luật sư, cũng như luật sư không cần phải trở thành chuyên gia đầu tư. Mỗi vai trò chuyên môn nên tập trung vào lĩnh vực của họ và nâng cao các công cụ năng suất của họ. Về mặt kỹ thuật, nếu một mô hình lớn học quá nhiều các nhiệm vụ không liên quan, nó có thể gặp phải tình trạng "quên lãng thảm khốc". Ví dụ, nếu Li Bai dành toàn bộ thời gian để làm kế toán thay vì viết thơ, cảm hứng thơ ca của anh ấy có thể dần phai nhạt. "Chúng tôi đã quan sát thấy rằng khi đào tạo các mô hình lớn cho miền dọc, nếu mô hình học quá nhiều hàm không liên quan, nó có thể ảnh hưởng đến khả năng ban đầu của nó. Do đó, việc phát triển các mô hình lớn 'hộp xám' hiệu quả cho miền dọc có giá trị lớn trong việc triển khai công nghiệp."

"Tôi tin rằng các mô hình lớn 'hộp xám' sẽ đóng vai trò ngày càng quan trọng trên con đường tiến tới AGI và trong việc triển khai các ngành công nghiệp miền dọc. Theo quan điểm phương pháp luận Bayesian, nó kết hợp kiến thức đã biết của chúng ta với thông tin ẩn trong dữ liệu để khám phá ra các định luật mới và giải quyết các vấn đề khoa học và công nghiệp", Qi Yuan tuyên bố. Trong tương lai, "AI Einstein" cũng có thể là "AI Buffett".

Kết nối chuỗi đổi mới sáng tạo và xây dựng hệ sinh thái đổi mới trí tuệ khoa học.

Tại Hội nghị Trí tuệ nhân tạo thế giới năm nay, nhóm của Qi Yuan đã ra mắt các mô hình lớn về tài chính và y tế đáng tin cậy với hàng trăm tỷ tham số. Các mô hình lớn miền dọc này đã vượt qua mô hình tham số nghìn tỷ GPT-4 Turbo của OpenAI trong quá trình thử nghiệm, một lần nữa thu hút sự chú ý của ngành vào việc triển khai các mô hình lớn.

"Những đột phá về AI ngày nay không chỉ được thúc đẩy bởi những đổi mới trong các nguyên tắc cơ bản mà còn bởi các phương pháp tiếp cận hướng đến sản phẩm nhằm giải quyết các nhu cầu của xã hội. Xã hội không chỉ yêu cầu công bố các bài báo lý thuyết hoặc đổi mới mô hình kinh doanh mà còn yêu cầu tích hợp sâu các đổi mới công nghệ và công nghiệp dựa trên các nguyên tắc đầu tiên. Khi hai yếu tố này được kết hợp, chúng ta có thể vươn tới vùng biển xanh hơn", Qi Yuan cho biết.

Học viện và ngành công nghiệp có những sứ mệnh khác nhau. Học viện khám phá những hiện tượng mới, trong khi ngành công nghiệp chủ yếu giải quyết các vấn đề thực tế. Một vấn đề chung trên toàn thế giới là các tổ chức nghiên cứu cần giải quyết nhiều vấn đề đổi mới công nghệ, nhưng nếu họ bỏ qua sản xuất và nhu cầu xã hội, họ sẽ phải đối mặt với hai thiếu sót: thiếu áp lực cạnh tranh thực sự, cản trở việc tinh chỉnh các công nghệ đổi mới và thiếu phản hồi thị trường hiệu quả để hướng dẫn nghiên cứu công nghệ.

Để đạt được mục tiêu này, Qi Yuan từ lâu đã tìm cách kết nối chuỗi đổi mới của "các trường đại học-viện nghiên cứu-công ty khởi nghiệp" để tạo ra một hệ sinh thái đổi mới tốt, xem xét cả công nghệ cơ bản và nhu cầu thị trường. Định hướng sản phẩm phải được hướng dẫn bởi nhu cầu và kịch bản thị trường, xây dựng năng lực cạnh tranh cốt lõi của sản phẩm thông qua đổi mới nền tảng.

Được thành lập vào năm 2023, SAIRI cam kết với những sáng kiến AI for Science nguyên bản kết hợp kiến thức và dữ liệu. Gần đây, SAIRI đã ra mắt loạt mô hình khí tượng lớn Fuxi 2.0 cho các ứng dụng trong năng lượng mới, bảo hiểm, quản lý đô thị và khởi xướng Liên minh hệ sinh thái đổi mới khí tượng thông minh. Liên minh này nhằm mục đích thúc đẩy dần dần ứng dụng công nghiệp của loạt mô hình khí tượng lớn Fuxi 2.0. Các mô hình lớn đáng tin cậy "hộp xám" cũng đang tiến triển trong việc triển khai sản phẩm, với Infinite Lightyear, công ty mô hình lớn đáng tin cậy do Qi Yuan sáng lập, đã được thành lập.

Để thúc đẩy hơn nữa hệ sinh thái đổi mới trí tuệ khoa học, Cuộc thi trí tuệ khoa học thế giới lần thứ hai, do SAIRI và Đại học Fudan đồng tổ chức, và được hướng dẫn bởi nhiều phòng ban bao gồm Ủy ban khoa học và công nghệ Thượng Hải, Ủy ban cải cách và phát triển Thượng Hải, Ủy ban kinh tế và công nghệ thông tin Thượng Hải và Ủy ban giáo dục Thượng Hải, đã được phát động. Cuộc thi cung cấp hàng triệu giải thưởng để tuyển dụng những người tham gia toàn cầu khám phá các lĩnh vực tiên phong của trí tuệ khoa học. Ngoài ra, SAIRI đã phát triển một nền tảng dữ liệu khoa học bao gồm dữ liệu khoa học đa phương thức, hỗ trợ toàn bộ chuỗi từ thu thập và xử lý dữ liệu đến quản lý và lập mô hình, đảm bảo xử lý dữ liệu hiệu quả, độ tin cậy và truyền thông an toàn. Dựa trên nền tảng này, SAIRI và các đối tác đã xây dựng một số tập dữ liệu khoa học chất lượng cao cho khoa học sự sống, khoa học vật liệu, khoa học khí quyển và các lĩnh vực khác, cung cấp các nguồn tài nguyên có giá trị cho nghiên cứu trí tuệ khoa học. Hơn nữa, SAIRI đã khởi xướng Liên minh hệ sinh thái dữ liệu khoa học toàn cầu, với các thành viên ban đầu bao gồm China Telecom Corporation, COSCO Shipping Insurance Captive, Shanghai Lingang New Area Cross-Border Data Technology và hơn mười tổ chức khác. Liên minh này hướng tới mục tiêu xây dựng một nền tảng mở và chia sẻ nguồn dữ liệu lớn nghiên cứu đa lĩnh vực toàn cầu thông qua sự hợp tác giữa chính phủ, doanh nghiệp, trường đại học và các viện nghiên cứu.

"Cho dù trong nghiên cứu khoa học hay công nghiệp, chúng ta không nên đổi mới chỉ vì mục đích đổi mới. Chúng tôi hy vọng xây dựng AGI trong tương lai và các ứng dụng có thể giải quyết các vấn đề trong thế giới thực", Qi Yuan cho biết.

Chúng ta còn cách xa trí tuệ nhân tạo chung đến mức nào