रियो के 'सबसे ताकतवर' AI मॉडल का सच: DeepSeek को हराने का दावा, असल में चीनी मॉडल की नकल निकली

ब्राज़ील की रियो डी जनेरियो सरकार ने Rio 3.5 नाम का AI मॉडल जारी कर DeepSeek और Qwen को पछाड़ने का दावा किया, लेकिन वज़न विश्लेषण में यह करीब 60% Nex N2 Pro और बाकी Qwen का मेल निकला।

ब्राज़ील के रियो डी जनेरियो शहर की IT एजेंसी IplanRIO ने 13 जून को Rio 3.5 नाम का एक AI मॉडल जारी किया और इसे फ्रंटियर श्रेणी का मॉडल बताया। एजेंसी के मुताबिक यह 397 अरब पैरामीटर वाला, उदार ओपन सोर्स लाइसेंस के साथ आने वाला मॉडल है, जिसे ग्लोबल साउथ के एक शहर की नगर सरकार ने बनाया है।

लॉन्च का वक्त एकदम सटीक था। ब्राज़ील अपना World Cup का पहला मुकाबला खेल रहा था और सोशल मीडिया पहले से ही गरम था। मॉडल की चर्चा तेज़ी से ब्राज़ील से निकलकर दुनिया भर में फैल गई। लेकिन जितनी तेज़ी से इसे शोहरत मिली, उतनी ही तेज़ी से यह सवाल उठ खड़ा हुआ कि असल में इस मॉडल को बनाया किसने।

 

शुरुआती दावे: किफ़ायती और ओपन
मूल मॉडल कार्ड में Rio 3.5 को Alibaba के ओपन बेस मॉडल Qwen 3.5 397B का पोस्ट ट्रेन बताया गया था, जिसके ऊपर SwiReasoning नाम की एक नई रीज़निंग परत जोड़ी गई थी। विकास की लागत R$500,000 बताई गई, हालांकि रियो ने इसकी पुष्टि नहीं की। यह रकम करीब $100,000 USD बैठती है, यानी बाज़ार में मिलने वाले बराबरी के AI सिस्टम के मुकाबले लगभग 30 गुना सस्ती।

मॉडल की बनावट Mixture-of-Experts है, जिसका मतलब है कि किसी भी एक टोकन पर 397 अरब में से सिर्फ़ करीब 17 अरब पैरामीटर ही सक्रिय होते हैं। इससे इसकी इन्फेरेंस लागत उसके बड़े आकार के हिसाब से कहीं कम पड़ती है। यह मॉडल विज़न और टेक्स्ट दोनों को संभालता है, एक दर्जन से ज़्यादा भाषाओं में काम करता है और पूरी तरह खुले MIT लाइसेंस के तहत आता है।

SwiReasoning का दावा क्या था
तकनीकी रूप से SwiReasoning ही इसका केंद्र था। यह एक ट्रेनिंग फ्री इन्फेरेंस ढांचा है जो दो तरीकों के बीच अपने आप बदलता रहता है। जब मॉडल अगले शब्द को लेकर आश्वस्त होता है, यानी संभावना के बंटवारे में एंट्रॉपी कम होती है, तो वह आम भाषा में सोचता है। जब अनिश्चितता होती है, तो वह लेटेंट रीज़निंग पर चला जाता है और बिना कोई टोकन निकाले अपनी छिपी आंतरिक अवस्थाओं में सोचता है। IplanRIO का कहना था कि Rio 3.5 को खासतौर पर इसी का फ़ायदा उठाने के लिए ट्रेन किया गया था और इसका असर बेंचमार्क के आंकड़ों में दिखता है।

आंकड़े जिन्होंने सुर्खियां बनाईं
खुद बताए गए ये आंकड़े चौंकाने वाले थे। Terminal-Bench 2.1, जो स्वचालित टर्मिनल कमांड चलाने की क्षमता मापता है और पास हुए कामों के प्रतिशत के रूप में आंका जाता है, उसमें Rio 3.5 ने 70.8% हासिल किया। इसने Qwen 3.7 Plus के 70.3% और ताकतवर DeepSeek v4 Pro के 67.9% को पीछे छोड़ दिया।

 
गणित ओलंपियाड बेंचमार्क IMOAnswerBench पर, जो सही जवाबों के प्रतिशत में आंका जाता है, Rio 3.5 ने 89.5% बनाए। HLE यानी Humanity's Last Exam, जो कई क्षेत्रों का लगभग हल न होने वाला विशेषज्ञ इम्तिहान है और प्रतिशत में मापा जाता है, उसमें Rio 3.5 ने 36.5% पाए, जो Qwen 3.7 Plus के 34.7% से आगे था।

एक नगर सरकार का सबसे अहम फ्लैगशिप मॉडलों को सबसे मायने रखने वाले गुणवत्ता बेंचमार्क पर हरा देना, यही वह सुर्खी थी जो फैली, खासकर तब जब रियो डी जनेरियो के मेयर ने इस पर ट्वीट किया।

 "पिछले एक साल में रियो में ट्रेन किया गया और रियो नगर पालिका के सार्वजनिक धन से तैयार हुआ एक ओपन AI मॉडल अभी अभी बाकी सभी मॉडलों से आगे निकल गया है," Eduardo Cavaliere ने लिखा। "आज दुनिया रियो में ट्रेन किए गए एक ओपन AI मॉडल की बात कर रही है।"

"रियो में ट्रेन हुआ" वाली बात पर सवाल
यही "रियो में ट्रेन हुआ" वाली बात पूरी तरह सही साबित नहीं हुई। शंघाई की एक ओपन सोर्स AI साझेदारी Nex-AGI ने रिलीज़ के कुछ दिन बाद X पर पोस्ट किया। शुरुआत इस तरह थी: "Rio 3.5 मॉडल ने इस हफ़्ते इंटरनेट तोड़ दिया। ट्विस्ट यह है कि यह असल में हमारा ही ओपन सोर्स मॉडल Nex N2 Pro है, बस अलग टोपी पहने हुए।"

 
उन्होंने मॉडल के वज़न का विश्लेषण किया था और गणित एकदम सटीक निकला: Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5। इसके साथ एक वेरिफ़िकेशन स्क्रिप्ट और पूरी GitHub रिपोर्ट भी जारी की गई।

सबूत के दो हिस्से
पहला हिस्सा व्यवहार से जुड़ा था। Nex ने तैनात मॉडल में से हार्डकोड किया हुआ "You are Rio" सिस्टम प्रॉम्प्ट हटाया और उससे पहचान को लेकर 120 सवाल पूछे। बिना उस मुखौटे के, Nex के मुताबिक मॉडल ने 79.2% बार खुद को "Nex, from Nex-AGI" बताया। उसने खुद को "Rio" ठीक 0% बार बताया। Nex का कहना है कि मॉडल ने कंपनी की खास पृष्ठभूमि भी हूबहू दोहराई और "Shanghai Innovation Institute" तथा "a large-model ecosystem alliance" का ज़िक्र किया। यह Nex का अपना ट्रेनिंग डेटा था, जो किसी और के मॉडल में उभर आया।

दूसरा हिस्सा गणितीय था। किसी असली वज़न मेल में नए मॉडल का हर पैरामीटर दोनों स्रोत मॉडलों के बीच एक सीधी रेखा पर बैठता है। Nex ने पूरी 60 परतों में इस सरेखता को नापा और नतीजा 0.993 आया। एक ही पैरामीटर स्थान में दो असंबंधित मॉडल संयोग से शून्य के आसपास स्कोर करते हैं। हर एक परत पर 0.993 पर पहुंचना कोई इत्तेफ़ाक नहीं है। मिश्रण का अनुपात α ≈ 0.571 पर टिका रहा, जो तीन दशमलव स्थानों तक स्थिर था। मोटे तौर पर यह करीब 60% Nex था, और बाकी बेस Qwen मॉडल।

 "रियो में हर वज़न टेंसर, हज़ारों मानक विचलन तक, Nex और Qwen का वही 0.6/0.4 मिश्रण है, और यह सभी 60 परतों तथा नेटवर्क के हर हिस्से में है," Nex ने लिखा। "इसकी कोई मासूम व्याख्या नहीं हो सकती।"
आंकड़ों ने एक और दबी हुई कहानी भी कही। Rio 3.5 से कुछ ही दिन पहले जारी हुआ Nex N2 Pro, Terminal-Bench 2.1 पर 75.3% स्कोर करता है, जो रियो के 70.8% से ज़्यादा है। आर्थिक पूर्वानुमान बेंचमार्क GDPval पर, जो Elo जैसी रेटिंग में आंका जाता है, Nex 1,585 पर है जबकि रियो 1,533 पर। अगर रियो 60% Nex है, तो उम्मीद यही होगी कि वह Nex के अपने बेंचमार्क पर Nex से कम स्कोर करे, और वह करता भी है।

रियो की सफ़ाई: "गलत अपलोड"
IplanRIO ने Hugging Face का मॉडल कार्ड अपडेट किया। बेंचमार्क की तालिका हटा दी गई और श्रेय बदल दिया गया।

 "यह मॉडल nex-agi/Nex-N2-Pro और Qwen/Qwen3.5-397B-A17B के मेल से बना है, जिससे पहले एक ज़्यादा मज़बूत मॉडल से On-Policy Distillation की गई थी," अपडेट किए गए Readme में लिखा है। "हमने पिछले संस्करण में एक गलत अपलोड पकड़ा, जहां अंतिम डिस्टिल्ड मॉडल के बजाय बेस मर्ज किया हुआ संस्करण अपलोड हो गया था। इस भ्रम के लिए हम माफ़ी चाहते हैं और बहुत खेद प्रकट करते हैं।"
IplanRIO की ओर से कोई और सार्वजनिक बयान नहीं आया। अब Nex को श्रेय दिया गया है।

यह "गलत अपलोड" वाली व्याख्या ही असली दावा है। IplanRIO का कहना है कि असल में जो जारी करना था वह मर्ज किए गए बेस का डिस्टिल्ड संस्करण था, न कि कच्चा मर्ज खुद। ऑन पॉलिसी डिस्टिलेशन का मतलब है कि एक ज़्यादा मज़बूत टीचर मॉडल आउटपुट तैयार करता है और स्टूडेंट मॉडल उन पर ट्रेन होता है, साथ ही अपने भी आउटपुट बनाता है। यह कच्चे मर्ज से महंगा है, पर शुरू से ट्रेनिंग करने से सस्ता। अगर वह कदम सचमुच उठाया गया था, तो वह मर्ज के ऊपर कम से कम कुछ मौलिक काम ज़रूर दिखाता। पर IplanRIO के अपने मुताबिक जो असल में जारी हुआ, वह बिना किसी ऊपरी काम के सिर्फ़ मर्ज किया हुआ बेस था।

समुदाय की राय बंटी हुई
इसका मतलब क्या है, इस पर देखने वालों की राय बंट गई। टेक टिप्पणीकार Rafael Quintanilha ने उदार नज़रिया दिया: चूंकि Nex N2 Pro खुद Qwen पर बना है, इसलिए हो सकता है टीम ने नीचे की बुनियादी बनावट को ही श्रेय देकर छोड़ दिया हो। उन्होंने यह भी कहा कि मॉडल एक World Cup मुकाबले के दौरान वायरल हो गया और "ज़रूरी नहीं कि वह 'सार्वजनिक इस्तेमाल के लिए तैयार' रहा हो।"

डेवलपर और AI यूट्यूबर Lucas Montano ने कहा कि "दो ~400B श्रेणी के मॉडलों को मर्ज करना और फिर पॉलिसी डिस्टिलेशन लगाना मामूली काम नहीं है," साथ ही उन्होंने एक तकनीकी चूक और एक संचार की चूक, दोनों को माना।

AI शोधकर्ता Diego Ambrosio कम नरम रहे। मूल लॉन्च में Rio 3.5 को "स्वायत्त पोस्ट ट्रेनिंग और मालिकाना फाइन ट्यूनिंग" का नतीजा बताया गया था, ऐसी पेशकश जिससे लगता था कि यह मौलिक शोध है, कोई मर्ज नहीं।

मर्ज करना गैरकानूनी नहीं, छिपाना समस्या है
मॉडल मर्ज करना पूरी तरह कानूनी है। Nex N2 Pro Apache 2.0 के तहत आता है, यानी आप इसे इस्तेमाल कर सकते हैं, बदल सकते हैं और दोबारा बांट सकते हैं, बशर्ते श्रेय दें। Qwen 3.5 भी खुले लाइसेंस के तहत है। कोई अदालत नहीं जा रहा।

असली समस्या यह थी कि आउटपुट को स्वतंत्र रूप से विकसित काम के तौर पर पेश किया गया और सभी स्रोत मॉडलों के नाम नहीं बताए गए। ओपन सोर्स समुदाय यह पहले भी देख चुका है। इसी साल पहले Cursor के Composer 2 के बारे में पता चला था कि वह बिना बताए Moonshot के Kimi K2.5 पर बनाया गया था। प्रतिक्रिया तेज़ और साख से जुड़ी थी, कोई वकील नहीं, बस स्क्रीनशॉट।

मौजूदा ओपन मॉडलों के ऊपर बनाना आम बात है। जैसा TrendKia बता चुका है, खुले वज़न को आपस में जमाना और मर्ज करना तो लगभग अपनी एक अलग उपसंस्कृति है। नियम यह नहीं है कि "दूसरों के काम पर मत बनाओ।" नियम यह है: जो इस्तेमाल किया, वह बता दो।

संस्थागत दावे ने शोर बढ़ाया
इस मामले को आम श्रेय चूक से ज़्यादा शोरगुल वाला बनाने वाली बात थी इसका संस्थागत आवरण। कोई गुमनाम डेवलपर अपने नाम से एक फ्रैंकेनमर्ज जारी करे, यह एक बात है। एक नगर सरकार का इसके सहारे, वह भी World Cup के दौरान, सार्वजनिक क्षेत्र की AI संप्रभुता का दावा करना बिलकुल अलग बात है। "यह संसाधनों की बर्बादी थी," एक ब्राज़ीली टिप्पणीकार ने लिखा।

Nex ने इसे जंग नहीं बनाया। "हम सम्मानित महसूस करते हैं कि City of Rio ने SOTA प्रदर्शन पाने के लिए हमारे काम का इस्तेमाल किया," कंपनी ने X पर लिखा। "पर ओपन सोर्स की दुनिया में श्रेय देना मायने रखता है।"

IplanRIO अब सही, डिस्टिल्ड मॉडल को पूरे श्रेय के साथ अपलोड करने की कोशिश कर रहा है। जब वह आएगा, तो वही जांचें दोबारा चलेंगी और समुदाय को पता चल जाएगा कि डिस्टिलेशन ने सचमुच कुछ बदला या यह अब भी ज़्यादातर Nex ही है, बस अलग सिस्टम प्रॉम्प्ट के साथ।

इसका आप पर असर
यह खबर सीधे तौर पर AI डेवलपर्स, शोधकर्ताओं और ओपन सोर्स तकनीक में रुचि रखने वालों को छूती है।

• डेवलपर्स और शोधकर्ताओं के लिए: किसी मॉडल के बढ़े चढ़े बेंचमार्क दावों पर आंख मूंदकर भरोसा करने से पहले उसका स्रोत और लाइसेंस जांचना ज़रूरी है, क्योंकि वज़न विश्लेषण से असली बनावट उजागर हो सकती है।
• आम उपयोगकर्ताओं के लिए: Rio 3.5, Nex N2 Pro और Qwen 3.5 जैसे मॉडल खुले लाइसेंस पर उपलब्ध हैं, इसलिए उन्हें इस्तेमाल या मर्ज करना कानूनी है, बशर्ते मूल स्रोत को श्रेय दिया जाए।

सवाल-जवाब

1. Rio 3.5 असल में किस चीज़ से बना है?
वज़न विश्लेषण के मुताबिक यह करीब 60% Nex N2 Pro और बाकी Qwen 3.5 का मेल है, यानी सटीक रूप से Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5।

2. Nex-AGI ने नकल कैसे साबित की?
Nex ने दो तरह के सबूत दिए: मॉडल बिना मुखौटे के 79.2% बार खुद को Nex बताता था और 0% बार Rio, और सभी 60 परतों में सरेखता 0.993 निकली जो किसी असली मर्ज की ओर इशारा करती है।

3. क्या इस तरह मॉडल मर्ज करना गैरकानूनी है?
नहीं। Nex N2 Pro Apache 2.0 और Qwen 3.5 खुले लाइसेंस के तहत हैं, इसलिए इस्तेमाल और मर्ज करना कानूनी है, बशर्ते श्रेय दिया जाए। असली समस्या स्रोतों का नाम न बताना थी।

4. IplanRIO ने इस पर क्या सफ़ाई दी?
उसने इसे "गलत अपलोड" बताया और कहा कि अंतिम डिस्टिल्ड मॉडल के बजाय बेस मर्ज किया हुआ संस्करण गलती से अपलोड हो गया था, और अब वह सही डिस्टिल्ड मॉडल पूरे श्रेय के साथ अपलोड करने पर काम कर रहा है।

https://trendkia.com/ai/riyo-ke-sabase-takatavara-ai-modala-ka-sacha-deepseek-ko-harane-ka-dava-asala-me-1090
TrendKia — Har trend, sabse pehle.