Phiên bản nâng cao của Gemini cùng chế độ Deep Think chính thức đạt chuẩn huy chương Vàng tại Olympic Toán học Quốc tế

0:00 / 0:00
0:00
Olympic Toán học Quốc tế IMO là cuộc thi danh giá nhất dành cho các học sinh yêu toán thế giới, được tổ chức hàng năm từ 1959. Mỗi quốc gia tham dự đều cử 6 học sinh ưu tú bậc trung học tranh tài giải các bài toán cực kỳ khó thuộc các lĩnh vực đại số, tổ hợp, hình học & số học. Huy chương được trao cho khoảng một nửa số thí sinh, trong đó khoảng 8% đạt huy chương vàng. Gần đây, IMO cũng trở thành thử thách hấp dẫn cho các hệ thống AI – như thước đo cho khả năng tư duy và giải toán nâng cao.
Phiên bản nâng cao của Gemini cùng chế độ Deep Think chính thức đạt chuẩn huy chương Vàng tại Olympic Toán học Quốc tế

Gemini Deep Think – phiên bản nâng cao của mô hình trí tuệ nhân tạo do Google DeepMind phát triển – vừa chính thức đạt điểm số tương đương huy chương vàng tại Olympic Toán học Quốc tế (IMO) 2025, với 35/42 điểm, giải được 5/6 bài toán khó bậc nhất thế giới.

IMO – kỳ thi toán học danh giá nhất dành cho học sinh trung học – đã trở thành không chỉ là sân chơi của con người, mà còn là thước đo mới cho khả năng tư duy và suy luận logic của AI. Nếu như năm ngoái, các hệ thống AlphaProof và AlphaGeometry 2 của DeepMind mới chỉ dừng ở mức huy chương bạc với 28 điểm, thì năm nay, Gemini Deep Think đã tạo nên bước nhảy vọt khi lần đầu tiên đạt chuẩn vàng, theo đánh giá chính thức của ban điều phối IMO.

“Chúng tôi xác nhận rằng Google DeepMind đã đạt cột mốc đáng mong đợi, với 35/42 điểm – tương đương điểm số huy chương vàng. Các bài giải rõ ràng, chính xác và phần lớn dễ hiểu,” – Giáo sư Gregor Dolinar, Chủ tịch IMO nhận xét.

Không giống như các phiên bản trước đó vốn cần dịch đề bài sang ngôn ngữ hình thức và mất nhiều ngày xử lý, Gemini năm nay vận hành hoàn toàn bằng ngôn ngữ tự nhiên. Mô hình có thể hiểu trực tiếp đề bài và tạo ra các lời giải toán học nghiêm ngặt trong thời gian giới hạn 4,5 giờ – đúng như các thí sinh con người tại IMO.

Theo DeepMind, kết quả này có được nhờ sự kết hợp giữa chế độ “Deep Think” – phương thức tư duy song song giúp AI xem xét đồng thời nhiều hướng giải – cùng kỹ thuật học tăng cường mới và bộ dữ liệu gồm các lời giải toán học chất lượng cao. Gemini còn được bổ sung các hướng dẫn tổng quát về cách tiếp cận đề IMO.

Mặc dù chỉ mới ở giai đoạn thử nghiệm nội bộ, DeepMind cho biết sẽ sớm phát hành phiên bản Gemini Deep Think này cho các chuyên gia toán học và người dùng cao cấp thuộc hệ thống Google AI Ultra.

Được biết, hệ thống tham dự IMO 2025 của DeepMind được phát triển bởi một đội ngũ chuyên gia hàng đầu trong nhiều lĩnh vực như huấn luyện mô hình, suy luận, thiết kế dữ liệu và đánh giá chuyên môn. Ngoài Gemini, các hệ thống hình thức như AlphaGeometry và AlphaProof vẫn tiếp tục được nghiên cứu song song, hướng đến mục tiêu dài hạn là kết hợp giữa khả năng ngôn ngữ tự nhiên và suy luận hình thức có thể kiểm chứng.

Thành tựu tại IMO 2025 được đánh giá là một cột mốc quan trọng trên hành trình AI hỗ trợ và cộng tác cùng con người trong lĩnh vực toán học – lĩnh vực vốn yêu cầu mức độ suy luận trừu tượng cao. Các nhà phát triển kỳ vọng, những mô hình như Gemini sẽ sớm trở thành công cụ hỗ trợ đắc lực cho các nhà khoa học, kỹ sư và nhà nghiên cứu trong tương lai, góp phần thúc đẩy tri thức nhân loại.

IMO đã xác nhận các lời giải do hệ thống Gemini Deep Think đưa ra là đầy đủ và chính xác. Tuy nhiên, việc xác minh không bao gồm quy trình vận hành nội bộ hay cấu trúc nền tảng của mô hình.

Theo Deepmind
Ảnh minh hoạ.
Sóng nhiệt đại dương đe dọa hệ sinh thái biển California
(Ngày Nay) - Nhiệt độ nước biển tại khu vực Nam California (Mỹ) đang liên tiếp phá vỡ các kỷ lục lịch sử, dấy lên lo ngại về một đợt sóng nhiệt đại dương bất thường. Các nhà nghiên cứu cảnh báo rằng tình trạng áp cao khí quyển có thể phá hủy hệ sinh thái biển nếu còn tiếp diễn.
OPEC+ tiếp tục nới hạn ngạch khai thác dầu mỏ thêm 206.000 thùng/ngày
OPEC+ tiếp tục nới hạn ngạch khai thác dầu mỏ thêm 206.000 thùng/ngày
(Ngày Nay) - Tổ chức Các nước xuất khẩu dầu mỏ (OPEC) và các đồng minh - còn gọi là OPEC+ - ngày 5/4 đã nhất trí tăng hạn ngạch khai thác dầu mỏ thêm 206.000 thùng/ngày từ tháng 5 tới. Đây là mức tăng khiêm tốn và chủ yếu chỉ mang tính biểu tượng, do các thành viên chủ chốt trong liên minh không thể tăng sản lượng thực tế bởi cuộc chiến giữa Mỹ và Israel với Iran.
EU triển khai đầy đủ hệ thống kiểm soát xuất nhập cảnh mới từ ngày 10/4
EU triển khai đầy đủ hệ thống kiểm soát xuất nhập cảnh mới từ ngày 10/4
(Ngày Nay) - Từ ngày 10/4/2026, Liên minh châu Âu (EU) sẽ triển khai đầy đủ hệ thống kiểm soát xuất nhập cảnh mới mang tên EES (Entry/Exit System), đánh dấu bước chuyển quan trọng trong hoạt động quản lý biên giới khu vực Schengen. Việc áp dụng kiểm tra 100% đối với hành khách ngoài EU được dự báo sẽ gây ra tình trạng ùn tắc tại các sân bay, nhà ga quốc tế và cảng biển ngay trong những ngày đầu triển khai.
Loạt phim Việt làm nên “kỷ lục doanh thu lịch sử” trong Quý 1/2026
Vì sao phim Việt đầu năm đại thắng ngàn tỷ đồng?
(Ngày Nay) - Các phim Việt Nam ra rạp kể từ đầu năm 2026 đến hết tháng 3/2026 gặt thành công lớn khi lập kỷ lục doanh thu phòng vé lên tới 1.130 tỷ đồng , vượt qua con số 1.110 tỷ đồng cùng kỳ năm ngoái . Điều này cho thấy khán giả đang rất ủng hộ và thích xem phim Việt.
Tổng vốn đầu tư toàn xã hội tăng gần 11% vào Quý I
Tổng vốn đầu tư toàn xã hội tăng gần 11% vào Quý I
(Ngày Nay) - Cục Thống kê, Bộ Tài chính vừa công bố, hoạt động đầu tư trong quý I/2026 tiếp tục duy trì đà tăng trưởng tích cực, với quy mô vốn toàn xã hội mở rộng và dòng vốn đầu tư nước ngoài gia tăng rõ rệt.