Công nghệ AI trước cuộc đua chuyển hướng

0:00 / 0:00
0:00
(Ngày Nay) - Một kỷ nguyên mới đang đến khi các công ty AI đang chuyển hướng tập trung vào việc tinh chỉnh các mô hình hiện có và bổ sung cho chúng khả năng lập luận giống con người hơn.
Biểu tượng ChatGPT của Công ty OpenAI tại một văn phòng ở Washington DC. Ảnh: AFP/TTXVN
Biểu tượng ChatGPT của Công ty OpenAI tại một văn phòng ở Washington DC. Ảnh: AFP/TTXVN

Ngành trí tuệ nhân tạo (AI) đang trải qua một sự chuyển dịch mang tính nền tảng. Sau giai đoạn đẩy mạnh phát triển các mô hình ngôn ngữ lớn (LLM) ở tốc độ chưa từng có thông qua cung cấp thêm dữ liệu và tăng cường năng lực tính toán, các công ty AI hàng đầu như OpenAI đang thừa nhận những hạn chế của phương pháp “nhồi nhét nhiệt tình” này.

Thay vì chỉ đơn thuần theo đuổi các mô hình có kích thước lớn hơn, một kỷ nguyên mới đang đến - các công ty AI đang chuyển hướng tập trung vào việc tinh chỉnh các mô hình hiện có và bổ sung cho chúng khả năng lập luận giống con người hơn.

Sự chuyển dịch này có ý nghĩa sâu sắc đối với cuộc chạy đua AI đang diễn ra cùng các nguồn lực thúc đẩy nó.

Mô hình "o1" mới được OpenAI công bố là minh chứng cho sự thay đổi chiến lược này. Thay vì chỉ tăng quy mô, o1 kết hợp các kỹ thuật tiên tiến như "tính toán suy luận". Phương pháp này cho phép mô hình khám phá và đánh giá nhiều giải pháp tiềm năng trước khi chọn ra con đường tối ưu, mô phỏng quá trình cân nhắc của tư duy con người.

Cách tiếp cận này tỏ ra đặc biệt hiệu quả đối với các nhiệm vụ phức tạp đòi hỏi lập luận và ra quyết định sắc bén, chẳng hạn như các bài toán hoặc đoạn mã phức tạp.

Tại hội nghị TED về AI mới đây ở San Francisco (Mỹ), nhà nghiên cứu Noam Brown của OpenAI đã nhấn mạnh tác động đáng kể của kỹ thuật này: chỉ cần 20 giây “suy luận" của mô hình đã đạt được hiệu suất tương đương với việc tăng kích thước và thời lượng huấn luyện của mô hình lên tới 100.000 lần.

Ngoài tính toán thời gian kiểm tra, o1 còn được hưởng lợi từ cách tiếp cận chọn lọc dữ liệu, kết hợp phản hồi và kiến thức chuyên môn từ các tiến sĩ và chuyên gia trong ngành. Sự kết hợp giữa đào tạo chuyên biệt và mô hình cơ sở như GPT-4 góp phần tạo nên khả năng xử lý và lập luận phức tạp của o1.

OpenAI đã báo hiệu ý định mở rộng cách tiếp cận đào tạo phân lớp này sang các mô hình cơ sở có quy mô còn lớn hơn GPT-4, cho thấy cam kết dài hạn đối với chiến lược tinh chỉnh này. Ông Kevin Weil, Giám đốc Sản phẩm của OpenAI, nhấn mạnh quyết tâm duy trì lợi thế cạnh tranh của họ và tuyên bố ý định "đi trước ba bước" trong bối cảnh ngành AI đang phát triển vũ bão.

Sự thay đổi chiến lược của OpenAI cũng phản ánh một xu hướng rộng hơn trong ngành. Theo các nguồn thạo tin, các công ty phát triển AI lớn khác như Anthropic, xAI và Google DeepMind được cho là đang theo đuổi các kỹ thuật tương tự OpenAI - đặc biệt khi những hạn chế từ cách tiếp cận mở rộng mô hình thông qua “nhồi nhét” dữ liệu và khả năng tính toán đang ngày càng rõ ràng.

Việc đào tạo những mô hình khổng lồ này là một nỗ lực tốn kém, với mỗi "lần huấn luyện" cần đến hàng trăm chip chạy đồng thời và phát sinh chi phí hàng chục triệu USD. Những hệ thống phức tạp này dễ bị lỗi phần cứng và các nhà nghiên cứu thường phải mất nhiều tháng chờ đợi vì không thể xác định hiệu suất của mô hình cho đến khi kết thúc quá trình huấn luyện kéo dài.

Một vấn đề phức tạp nữa là nhu cầu dữ liệu khổng lồ của các mô hình này đã làm cạn kiệt các bộ dữ liệu dễ tiếp cận, trong khi tình trạng thiếu điện đặt ra một ràng buộc bổ sung cho quá trình huấn luyện. Những thách thức kết hợp này đang thúc đẩy việc khám phá các kỹ thuật hiệu quả và tiết kiệm hơn như tính toán thời gian kiểm tra.

Tác động của sự thay đổi này không chỉ đối với việc phát triển mô hình mà còn ảnh hưởng đáng kể đến phần cứng. Trong khi Nvidia đang thống trị thị trường chip huấn luyện, xu hướng ngày càng chú trọng vào khả năng suy luận của AI có thể tạo cơ hội cho các đối thủ cạnh tranh. Khả năng suy luận của AI yêu cầu một loại kiến trúc chip khác và Nvidia có thể phải đối mặt với cạnh tranh gay gắt hơn trong thị trường mới nổi này.

Những dịch chuyển trên cũng đã thu hút sự chú ý của các công ty đầu tư mạo hiểm nổi tiếng như Sequoia Capital và Andreessen Horowitz, vốn đã rót hàng tỷ USD tài trợ cho các mô hình AI khác nhau. Họ đang đánh giá lại tác động của sự thay đổi này đối với các khoản đầu tư đáng kể của mình.

Bà Sonya Huang, một đối tác tại Sequoia Capital, dự đoán sẽ có sự chuyển dịch khỏi các cụm mô hình cần huấn luyện quy mô lớn sang các mô hình có khả năng suy luận và lưu trữ dữ liệu trên đám mây.

Thừa nhận tầm quan trọng ngày càng tăng của suy luận đối với các mô hình AI, Nvidia cho rằng các chip Blackwell mới nhất của họ rất phù hợp với nhu cầu đang phát triển này.

Giám đốc điều hành (CEO) của công ty, Jensen Huang đã nhấn mạnh nhu cầu đối với những con chip của họ sẽ ngày càng tăng nhờ cái mà ông gọi là "định luật thứ hai về mở rộng quy mô". Tuy nhiên, bản chất năng động của ngành AI đồng nghĩa cuộc cạnh tranh giành vị trí thống trị trong phân khúc quan trọng này còn lâu mới kết thúc.

Một mô hình AI thông minh hơn không chỉ đơn giản là có quy mô lớn hơn mà còn phải biết thích nghi, đổi mới trong môi trường luôn thay đổi nhanh chóng này.

Tổng thống Vladimir Putin.
Ông Putin: Nga không tìm cách tái gia nhập G7
(Ngày Nay) - Tổng thống Vladimir Putin nói Nga không có kế hoạch quay lại Nhóm 7 nước công nghiệp phát triển (G7), đồng thời cho rằng tầm quan trọng của nhóm này tiếp tục suy giảm.
Ảnh minh hoạ.
Nhật Bản cấm cấy phôi thai đã qua chỉnh sửa gene
(Ngày Nay) - Ngày 4/12, một hội đồng chuyên gia của Chính phủ Nhật Bản cho biết nước này sẽ xây dựng quy định pháp lý cấm tuyệt đối việc cấy phôi thai đã chỉnh sửa gene vào cơ thể người hoặc động vật có vú, đồng thời áp dụng chế tài xử phạt đối với các vi phạm. Đây được xem là bước đi nhằm lấp khoảng trống pháp lý hiện nay và ngăn chặn việc tạo ra trẻ sơ sinh đã chỉnh sửa gene.
Nvidia công bố máy chủ AI mới có hiệu suất cao gấp 10 lần
Nvidia công bố máy chủ AI mới có hiệu suất cao gấp 10 lần
(Ngày Nay) - Nvidia đã công bố dữ liệu mới nhất cho thấy máy chủ trí tuệ nhân tạo (AI) mới của hãng có khả năng nâng cao hiệu suất của các mô hình AI tiên tiến, bao gồm những mô hình phổ biến từ Trung Quốc, lên đến 10 lần so với thế hệ máy chủ trước đó.
Nhà, đất đang rơi vào tay giới đầu cơ và trục lợi chính sách?
Nhà, đất đang rơi vào tay giới đầu cơ và trục lợi chính sách?
(Ngày Nay) -“Thị trường BĐS bị các đối tượng đầu cơ thao túng, đẩy giá, chính sách nhà ở xã hội bị trục lợi, giá nhà đất liên tục leo thang, vượt xa tầm với của người dân có nhu cầu ở thực dẫn tới tình trạng nhà, đất chủ yếu rơi vào tay giới đầu cơ và trục lợi chính sách”, là những vấn đề trăn trở được các chuyên gia BĐS và hoạch định chính sách bàn luận tại Diễn đàn “Xây dựng thị trường BĐS lành mạnh, bền vững – năm 2025” của Đài PTTH Hà Nội, nhằm tìm ra giải pháp chấn chỉnh, khắc phục.