<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Lưu trữ học tăng cường - Tenten AI</title>
	<atom:link href="https://tenten.vn/ai/tag/hoc-tang-cuong/feed/" rel="self" type="application/rss+xml" />
	<link>https://tenten.vn/ai/tag/hoc-tang-cuong/</link>
	<description>Chia sẻ kiến thức về AI</description>
	<lastBuildDate>Fri, 07 Mar 2025 03:41:31 +0000</lastBuildDate>
	<language>vi</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=7.0</generator>

<image>
	<url>https://tenten.vn/ai/wp-content/uploads/2022/09/cropped-skyperry-32x32.png</url>
	<title>Lưu trữ học tăng cường - Tenten AI</title>
	<link>https://tenten.vn/ai/tag/hoc-tang-cuong/</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>QwQ-32B, bước tiến lớn của Alibaba với AI học tăng cường</title>
		<link>https://tenten.vn/ai/qwq-32b-buoc-tien-lon-cua-alibaba-voi-ai-hoc-tang-cuong/</link>
		
		<dc:creator><![CDATA[Quản trị viên]]></dc:creator>
		<pubDate>Fri, 07 Mar 2025 03:40:46 +0000</pubDate>
				<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[Alibaba]]></category>
		<category><![CDATA[học tăng cường]]></category>
		<category><![CDATA[QwQ-32B]]></category>
		<guid isPermaLink="false">https://tenten.vn/ai/?p=11610</guid>

					<description><![CDATA[<p>Vào ngày 5/3, Alibaba cho ra mắt mô hình mới nhất QwQ-32B &#8211; QwenAI. Mô hình AI này có 32 tỷ tham số, và có hiệu suất vượt qua cả DeepSeek-R1. Đây là bước tiến lớn nhờ Học Tăng Cường (RL) giúp tối ưu hiệu suất trên nền tảng mạnh mẽ. Cùng Tenten.vn khám phá &#8230;</p>
<p>Bài viết <a href="https://tenten.vn/ai/qwq-32b-buoc-tien-lon-cua-alibaba-voi-ai-hoc-tang-cuong/">QwQ-32B, bước tiến lớn của Alibaba với AI học tăng cường</a> đã xuất hiện đầu tiên vào ngày <a href="https://tenten.vn/ai">Tenten AI</a>.</p>
]]></description>
										<content:encoded><![CDATA[<p><span style="font-weight: 400;">Vào ngày 5/3, Alibaba cho ra mắt mô hình mới nhất QwQ-32B &#8211; </span><a href="https://tenten.vn/ai/qwen-ai-tich-hop-vao-iphone-tai-trung-quoc/"><span style="font-weight: 400;">QwenAI</span></a><span style="font-weight: 400;">. Mô hình AI này có 32 tỷ tham số, và có hiệu suất vượt qua cả DeepSeek-R1. Đây là bước tiến lớn nhờ Học Tăng Cường (RL) giúp tối ưu hiệu suất trên nền tảng mạnh mẽ. Cùng </span><a href="https://tenten.vn/vi"><span style="font-weight: 400;">Tenten.vn</span></a><span style="font-weight: 400;"> khám phá sức mạnh của QwQ-32B từ Alibaba nhé!</span></p>
<p><img loading="lazy" decoding="async" class="aligncenter wp-image-11611 size-full" src="https://tenten.vn/ai/wp-content/uploads/2025/03/QwQ-32B-buoc-tien-lon-cua-Alibaba-voi-AI-hoc-tang-cuong-1.jpg" alt="QwQ-32B-buoc-tien-lon-cua-Alibaba-voi-AI-hoc-tang-cuong-1" width="600" height="330" srcset="https://tenten.vn/ai/wp-content/uploads/2025/03/QwQ-32B-buoc-tien-lon-cua-Alibaba-voi-AI-hoc-tang-cuong-1.jpg 600w, https://tenten.vn/ai/wp-content/uploads/2025/03/QwQ-32B-buoc-tien-lon-cua-Alibaba-voi-AI-hoc-tang-cuong-1-300x165.jpg 300w" sizes="(max-width: 600px) 100vw, 600px" /></p>
<h2><b>QwQ-32B: Sự Kết Hợp Giữa Học Tăng Cường Và Tư Duy Nhân Tạo</b></h2>
<p><span style="font-weight: 400;">Điểm đột phá của QwQ-32B nằm ở việc tích hợp thành công các khả năng của tác nhân (agent) vào mô hình suy luận. Điều này giúp mô hình có thể:</span></p>
<ul>
<li style="font-weight: 400;" aria-level="1"><b>Tư duy phản biện</b><span style="font-weight: 400;">: Khả năng đánh giá và điều chỉnh quyết định dựa trên dữ liệu đầu vào.</span></li>
<li style="font-weight: 400;" aria-level="1"><b>Sử dụng công cụ</b><span style="font-weight: 400;">: Áp dụng các công cụ tính toán, lập trình để giải quyết vấn đề.</span></li>
<li style="font-weight: 400;" aria-level="1"><b>Thích ứng với phản hồi</b><span style="font-weight: 400;">: Điều chỉnh phương pháp tiếp cận dựa trên phản hồi từ môi trường.</span></li>
</ul>
<h2><b>Hiệu Suất Ấn Tượng Của QwQ-32B</b></h2>
<p><span style="font-weight: 400;">QwQ-32B đạt hiệu suất tương đương với </span><a href="https://fpt-is.com/goc-nhin-so/deepseek-la-gi-kham-pha-chi-tiet-mo-hinh-deepseek-r1/"><span style="font-weight: 400;">DeepSeek-R1</span></a><span style="font-weight: 400;">, một mô hình AI có đến 671 tỷ tham số (trong đó 37 tỷ được kích hoạt). Đây là minh chứng rõ ràng cho hiệu quả của RL trong việc thu hẹp khoảng cách giữa kích thước mô hình và hiệu suất thực tế.</span></p>
<p><img loading="lazy" decoding="async" class="aligncenter wp-image-11612 size-full" src="https://tenten.vn/ai/wp-content/uploads/2025/03/QwQ-32B-buoc-tien-lon-cua-Alibaba-voi-AI-hoc-tang-cuong-2.jpg" alt="QwQ-32B-buoc-tien-lon-cua-Alibaba-voi-AI-hoc-tang-cuong-2" width="600" height="330" srcset="https://tenten.vn/ai/wp-content/uploads/2025/03/QwQ-32B-buoc-tien-lon-cua-Alibaba-voi-AI-hoc-tang-cuong-2.jpg 600w, https://tenten.vn/ai/wp-content/uploads/2025/03/QwQ-32B-buoc-tien-lon-cua-Alibaba-voi-AI-hoc-tang-cuong-2-300x165.jpg 300w" sizes="(max-width: 600px) 100vw, 600px" /></p>
<p><span style="font-weight: 400;">Mô hình này đã được đánh giá qua nhiều bộ tiêu chuẩn khác nhau để kiểm tra khả năng suy luận toán học, lập trình và giải quyết vấn đề:</span></p>
<ul>
<li style="font-weight: 400;" aria-level="1"><b>AIME24:</b><span style="font-weight: 400;"> QwQ-32B đạt 79.5, gần bằng DeepSeek-R1-6718 (79.8) và cao hơn nhiều so với OpenAI-o1-mini (63.6).</span></li>
<li style="font-weight: 400;" aria-level="1"><b>LiveCodeBench:</b><span style="font-weight: 400;"> Đạt 63.4, chỉ thấp hơn một chút so với DeepSeek-R1-6718 (65.9), nhưng cao hơn OpenAI-o1-mini (53.8).</span></li>
<li style="font-weight: 400;" aria-level="1"><b>LiveBench:</b><span style="font-weight: 400;"> Ghi nhận điểm số 73.1, vượt qua DeepSeek-R1-6718 (71.6) và bỏ xa OpenAI-o1-mini (57.5).</span></li>
<li style="font-weight: 400;" aria-level="1"><b>IFEval:</b><span style="font-weight: 400;"> Đạt 83.9, ngang bằng với DeepSeek-R1-6718 (83.3) và cao hơn OpenAI-o1-mini (59.1).</span></li>
<li style="font-weight: 400;" aria-level="1"><b>BFCL:</b><span style="font-weight: 400;"> Ghi điểm 66.4, cao hơn DeepSeek-R1-6718 (62.8) và vượt xa OpenAI-o1-mini (49.3).</span></li>
</ul>
<h2><b>Là tương Lai Của AI Nguồn Mở</b></h2>
<p><span style="font-weight: 400;">Một trong những điểm đặc biệt của QwQ-32B là việc nó được phát hành với mã nguồn mở trên Hugging Face và ModelScope theo giấy phép Apache 2.0. Điều này có nghĩa là cộng đồng AI có thể tiếp cận và thử nghiệm mô hình thông qua nền tảng Qwen Chat.</span></p>
<p><img loading="lazy" decoding="async" class="aligncenter wp-image-11613 size-full" src="https://tenten.vn/ai/wp-content/uploads/2025/03/QwQ-32B-buoc-tien-lon-cua-Alibaba-voi-AI-hoc-tang-cuong-3.jpg" alt="QwQ-32B-buoc-tien-lon-cua-Alibaba-voi-AI-hoc-tang-cuong-3" width="600" height="330" srcset="https://tenten.vn/ai/wp-content/uploads/2025/03/QwQ-32B-buoc-tien-lon-cua-Alibaba-voi-AI-hoc-tang-cuong-3.jpg 600w, https://tenten.vn/ai/wp-content/uploads/2025/03/QwQ-32B-buoc-tien-lon-cua-Alibaba-voi-AI-hoc-tang-cuong-3-300x165.jpg 300w" sizes="(max-width: 600px) 100vw, 600px" /></p>
<p><span style="font-weight: 400;">Nhóm Qwen coi đây là bước đầu tiên trong việc mở rộng RL để nâng cao khả năng suy luận, đồng thời hướng tới việc tích hợp các tác nhân AI với RL nhằm đạt được khả năng suy luận dài hạn.</span></p>
<h2><b>Hướng Tới Trí Tuệ Nhân Tạo Tổng Quát (AGI)</b></h2>
<p><span style="font-weight: 400;">Nhóm Qwen tin rằng mô hình nền tảng mạnh kết hợp với Học Tăng Cường (RL) sẽ là chìa khóa dẫn tối AGI. AGI là Trí tuệ Nhân tạo Tổng quát, là mục tiêu lớn của ngành công nghệ.</span></p>
<p><span style="font-weight: 400;">Nhóm nghiên cứu Qwen chia sẻ: &#8220;Thế hệ tiếp theo của Qwen sẽ tiến gần hơn đến AGI. Chúng tôi kết hợp mô hình mạnh mẽ với RL quy mô lớn.&#8221;</span></p>
<p><span style="font-weight: 400;">QwQ-32B đánh dấu bước tiến quan trọng của Alibaba. Nó cho thấy tương lai AI không chỉ dựa vào quy mô mô hình. Học Tăng Cường giúp AI hiệu quả hơn mà không cần kích thước quá lớn như trước.</span></p>
<h2><b>Kết luận</b></h2>
<p><span style="font-weight: 400;">QwQ-32B là minh chứng cho tầm nhìn của Alibaba trong AI. Học Tăng Cường (RL) mở ra mộthướng đi mới của AI. Nó giúp mô hình hiệu quả mà không cần kích thước khổng lồ. Tương lai AI sẽ sáng hơn, và cũng cạnh tranh gay gắt hơn. Hãy cùng Tenten.vn theo dõi </span><a href="https://tenten.vn/ai/"><span style="font-weight: 400;">tin tức</span></a><span style="font-weight: 400;"> tiếp theo của QwQ-32B nhé!</span></p>
<p>Bài viết <a href="https://tenten.vn/ai/qwq-32b-buoc-tien-lon-cua-alibaba-voi-ai-hoc-tang-cuong/">QwQ-32B, bước tiến lớn của Alibaba với AI học tăng cường</a> đã xuất hiện đầu tiên vào ngày <a href="https://tenten.vn/ai">Tenten AI</a>.</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
