Công nghệ AI trước cuộc đua chuyển hướng

0:00 / 0:00
0:00
(Ngày Nay) - Một kỷ nguyên mới đang đến khi các công ty AI đang chuyển hướng tập trung vào việc tinh chỉnh các mô hình hiện có và bổ sung cho chúng khả năng lập luận giống con người hơn.
Biểu tượng ChatGPT của Công ty OpenAI tại một văn phòng ở Washington DC. Ảnh: AFP/TTXVN
Biểu tượng ChatGPT của Công ty OpenAI tại một văn phòng ở Washington DC. Ảnh: AFP/TTXVN

Ngành trí tuệ nhân tạo (AI) đang trải qua một sự chuyển dịch mang tính nền tảng. Sau giai đoạn đẩy mạnh phát triển các mô hình ngôn ngữ lớn (LLM) ở tốc độ chưa từng có thông qua cung cấp thêm dữ liệu và tăng cường năng lực tính toán, các công ty AI hàng đầu như OpenAI đang thừa nhận những hạn chế của phương pháp “nhồi nhét nhiệt tình” này.

Thay vì chỉ đơn thuần theo đuổi các mô hình có kích thước lớn hơn, một kỷ nguyên mới đang đến - các công ty AI đang chuyển hướng tập trung vào việc tinh chỉnh các mô hình hiện có và bổ sung cho chúng khả năng lập luận giống con người hơn.

Sự chuyển dịch này có ý nghĩa sâu sắc đối với cuộc chạy đua AI đang diễn ra cùng các nguồn lực thúc đẩy nó.

Mô hình "o1" mới được OpenAI công bố là minh chứng cho sự thay đổi chiến lược này. Thay vì chỉ tăng quy mô, o1 kết hợp các kỹ thuật tiên tiến như "tính toán suy luận". Phương pháp này cho phép mô hình khám phá và đánh giá nhiều giải pháp tiềm năng trước khi chọn ra con đường tối ưu, mô phỏng quá trình cân nhắc của tư duy con người.

Cách tiếp cận này tỏ ra đặc biệt hiệu quả đối với các nhiệm vụ phức tạp đòi hỏi lập luận và ra quyết định sắc bén, chẳng hạn như các bài toán hoặc đoạn mã phức tạp.

Tại hội nghị TED về AI mới đây ở San Francisco (Mỹ), nhà nghiên cứu Noam Brown của OpenAI đã nhấn mạnh tác động đáng kể của kỹ thuật này: chỉ cần 20 giây “suy luận" của mô hình đã đạt được hiệu suất tương đương với việc tăng kích thước và thời lượng huấn luyện của mô hình lên tới 100.000 lần.

Ngoài tính toán thời gian kiểm tra, o1 còn được hưởng lợi từ cách tiếp cận chọn lọc dữ liệu, kết hợp phản hồi và kiến thức chuyên môn từ các tiến sĩ và chuyên gia trong ngành. Sự kết hợp giữa đào tạo chuyên biệt và mô hình cơ sở như GPT-4 góp phần tạo nên khả năng xử lý và lập luận phức tạp của o1.

OpenAI đã báo hiệu ý định mở rộng cách tiếp cận đào tạo phân lớp này sang các mô hình cơ sở có quy mô còn lớn hơn GPT-4, cho thấy cam kết dài hạn đối với chiến lược tinh chỉnh này. Ông Kevin Weil, Giám đốc Sản phẩm của OpenAI, nhấn mạnh quyết tâm duy trì lợi thế cạnh tranh của họ và tuyên bố ý định "đi trước ba bước" trong bối cảnh ngành AI đang phát triển vũ bão.

Sự thay đổi chiến lược của OpenAI cũng phản ánh một xu hướng rộng hơn trong ngành. Theo các nguồn thạo tin, các công ty phát triển AI lớn khác như Anthropic, xAI và Google DeepMind được cho là đang theo đuổi các kỹ thuật tương tự OpenAI - đặc biệt khi những hạn chế từ cách tiếp cận mở rộng mô hình thông qua “nhồi nhét” dữ liệu và khả năng tính toán đang ngày càng rõ ràng.

Việc đào tạo những mô hình khổng lồ này là một nỗ lực tốn kém, với mỗi "lần huấn luyện" cần đến hàng trăm chip chạy đồng thời và phát sinh chi phí hàng chục triệu USD. Những hệ thống phức tạp này dễ bị lỗi phần cứng và các nhà nghiên cứu thường phải mất nhiều tháng chờ đợi vì không thể xác định hiệu suất của mô hình cho đến khi kết thúc quá trình huấn luyện kéo dài.

Một vấn đề phức tạp nữa là nhu cầu dữ liệu khổng lồ của các mô hình này đã làm cạn kiệt các bộ dữ liệu dễ tiếp cận, trong khi tình trạng thiếu điện đặt ra một ràng buộc bổ sung cho quá trình huấn luyện. Những thách thức kết hợp này đang thúc đẩy việc khám phá các kỹ thuật hiệu quả và tiết kiệm hơn như tính toán thời gian kiểm tra.

Tác động của sự thay đổi này không chỉ đối với việc phát triển mô hình mà còn ảnh hưởng đáng kể đến phần cứng. Trong khi Nvidia đang thống trị thị trường chip huấn luyện, xu hướng ngày càng chú trọng vào khả năng suy luận của AI có thể tạo cơ hội cho các đối thủ cạnh tranh. Khả năng suy luận của AI yêu cầu một loại kiến trúc chip khác và Nvidia có thể phải đối mặt với cạnh tranh gay gắt hơn trong thị trường mới nổi này.

Những dịch chuyển trên cũng đã thu hút sự chú ý của các công ty đầu tư mạo hiểm nổi tiếng như Sequoia Capital và Andreessen Horowitz, vốn đã rót hàng tỷ USD tài trợ cho các mô hình AI khác nhau. Họ đang đánh giá lại tác động của sự thay đổi này đối với các khoản đầu tư đáng kể của mình.

Bà Sonya Huang, một đối tác tại Sequoia Capital, dự đoán sẽ có sự chuyển dịch khỏi các cụm mô hình cần huấn luyện quy mô lớn sang các mô hình có khả năng suy luận và lưu trữ dữ liệu trên đám mây.

Thừa nhận tầm quan trọng ngày càng tăng của suy luận đối với các mô hình AI, Nvidia cho rằng các chip Blackwell mới nhất của họ rất phù hợp với nhu cầu đang phát triển này.

Giám đốc điều hành (CEO) của công ty, Jensen Huang đã nhấn mạnh nhu cầu đối với những con chip của họ sẽ ngày càng tăng nhờ cái mà ông gọi là "định luật thứ hai về mở rộng quy mô". Tuy nhiên, bản chất năng động của ngành AI đồng nghĩa cuộc cạnh tranh giành vị trí thống trị trong phân khúc quan trọng này còn lâu mới kết thúc.

Một mô hình AI thông minh hơn không chỉ đơn giản là có quy mô lớn hơn mà còn phải biết thích nghi, đổi mới trong môi trường luôn thay đổi nhanh chóng này.

Học tập suốt đời: Chìa khóa để nâng cao dân trí, xã hội phát triển thịnh vượng, bền vững
Học tập suốt đời: Chìa khóa để nâng cao dân trí, xã hội phát triển thịnh vượng, bền vững
(Ngày Nay) - Trong bài viết "Học tập suốt đời", Tổng Bí thư Tô Lâm nhấn mạnh: Chỉ có học tập suốt đời, mỗi cá nhân mới có thể thích nghi, làm giàu trí tuệ, hoàn thiện nhân cách và vững vàng trước mọi thách thức. Đó là chìa khóa để phát triển bản thân trong xã hội hiện đại; cao hơn, đây là chìa khóa quan trọng để nâng cao dân trí và đào tạo nhân lực, thúc đẩy sự phát triển kinh tế - xã hội, là con đường duy nhất, hướng đi tất yếu của mọi quốc gia để đảm bảo sự phát triển thịnh vượng, bền vững.
AI - Động lực mới để Việt Nam thúc đẩy tăng trưởng kinh tế
AI - Động lực mới để Việt Nam thúc đẩy tăng trưởng kinh tế
(Ngày Nay) -  Theo Google, trí tuệ nhân tạo (AI) đang trở thành "người hùng" mới của kinh tế Việt Nam khi có tiềm năng đóng góp 79,3 tỷ USD vào năm 2030, tương đương gần 12% GDP. Từ chiến lược quốc gia đến những bước đi của doanh nghiệp công nghệ, Việt Nam không chỉ mơ ước mà đã hành động để biến AI thành động lực tăng trưởng.
Công bố Bộ tượng Tam Tổ Trúc Lâm chùa Vĩnh Nghiêm là bảo vật Quốc gia
Công bố Bộ tượng Tam Tổ Trúc Lâm chùa Vĩnh Nghiêm là bảo vật Quốc gia
(Ngày Nay) -  Tối ngày 10/3 (tức ngày 11/2 âm lịch), tại chùa Vĩnh Nghiêm, xã Trí Yên, thành phố Bắc Giang, tỉnh Bắc Giang, UBND thành phố Bắc Giang phối hợp với Giáo hội Phật giáo Việt Nam tỉnh Bắc Giang tổ chức khai mạc Lễ hội chùa Vĩnh Nghiêm năm 2025 và công bố Quyết định của Thủ tướng Chính phủ về việc công nhận bảo vật Quốc gia.
Nga tăng cường áp lực quân sự: Tín hiệu cứng rắn trước đàm phán Mỹ - Ukraine
Nga tăng cường áp lực quân sự: Tín hiệu cứng rắn trước đàm phán Mỹ - Ukraine
(Ngày Nay) -  Trong tuần qua, Nga đã thực hiện hơn 2.100 cuộc không kích vào Ukraine, làm gia tăng căng thẳng trên chiến trường trước thềm đàm phán Mỹ - Ukraine tại Saudi Arabia. Khi Kiev và Washington chuẩn bị cho cuộc đối thoại quan trọng, Moskva đẩy mạnh các chiến dịch quân sự nhằm giành ưu thế chiến lược.
Bắc Bộ và Bắc Trung Bộ mưa phùn trong ngày 10/3
Bắc Bộ và Bắc Trung Bộ mưa phùn trong ngày 10/3
(Ngày Nay) - Theo Trung tâm Dự báo Khí tượng Thủy văn Quốc gia, ngày 10/3, Bắc Bộ trời nhiều mây, sáng và đêm có mưa nhỏ, mưa phùn và sương mù rải rác, trời rét. Tây Nguyên và Nam Bộ có mây, có mưa rào và dông vài nơi.
Đội tuyển Việt Nam còn chỗ cho Đặng Văn Lâm?
Đội tuyển Việt Nam còn chỗ cho Đặng Văn Lâm?
(Ngày Nay) - Cuối tuần trước, khi HLV Kim Sang Sik công bố danh sách đội tuyển Việt Nam tập trung chuẩn bị cho đợt FIFA Days tháng 3/2025, dư luận đã không khỏi bất ngờ khi thủ môn Đặng Văn Lâm không có tên trong danh sách triệu tập.