चीनी टेक कंपनी मेइतुआन ने 30 जून को लॉन्गकैट-2.0 से पर्दा उठाया और इसके साथ ही यह पुष्टि हो गई कि ओपन-लाइसेंस वाला यह 1.6 ट्रिलियन पैरामीटर वाला मिक्सचर-ऑफ-एक्सपर्ट्स (MoE) मॉडल वही सिस्टम है जो पिछले दो महीने से ओपनराउटर पर आउल अल्फा के छद्म नाम से चुपचाप चल रहा था। हफ्तों तक डेवलपर्स इस पर असली काम चला रहे थे, बिना यह जाने कि इसे बनाया किसने है।
विशाल आकार, पर पूरा जोर एक बार में नहीं
पैरामीटर वे तमाम डायल होते हैं जिन्हें कोई मॉडल ट्रेनिंग के दौरान एडजस्ट कर सकता है, और लॉन्गकैट-2.0 में इनकी संख्या पूरे 1.6 ट्रिलियन है। लेकिन यह इन सबका इस्तेमाल एक साथ नहीं करता। हर टोकन (डेटा का सबसे छोटा टुकड़ा जिसे कोई AI पढ़ता है) के लिए मॉडल करीब 48 अरब पैरामीटर सक्रिय करता है, और यह आंकड़ा सवाल की कठिनाई के हिसाब से 33 अरब से 56 अरब के बीच घटता-बढ़ता रहता है। इतने बड़े मॉडल को व्यावहारिक रूप से तेज बनाए रखने की असली वजह यही चुनिंदा सक्रियता है।
दो महीने की गुमनामी रंग लाई
गुमनाम रहकर चलना फायदे का सौदा साबित हुआ। जब तक मेइतुआन ने इस पर अपना नाम लगाया, तब तक आउल अल्फा हर्मीस एजेंट वर्कस्पेस पर पहले नंबर पर पहुंच चुका था, क्लॉड कोड पर दूसरे और ओपनक्लॉ डिप्लॉयमेंट्स में तीसरे स्थान पर था। ये तीनों रैंकिंग मासिक कॉल वॉल्यूम के आधार पर तय हुईं। यानी लोग इसका मॉडल किसका है यह जानने से बहुत पहले ही अपने इस्तेमाल से इसके पक्ष में वोट दे रहे थे।
पूरी तरह चीनी चिप पर बना पहला ट्रिलियन-पैरामीटर मॉडल
इस लॉन्च को खास बनाती है इसकी जन्मस्थली। लॉन्गकैट-2.0 पहला ऐसा ट्रिलियन-पैरामीटर मॉडल है जिसकी ट्रेनिंग और तैनाती शुरू से आखिर तक घरेलू चीनी ASIC पर हुई है, न कि कहीं और ट्रेनिंग के बाद सिर्फ उन पर चलाया गया हो। डीपसीक के V4-Pro से इसका फर्क साफ है: वह मॉडल हुआवे की चिप का इस्तेमाल केवल इन्फरेंस के लिए करता था, जबकि उसकी प्री-ट्रेनिंग एनविडिया के हार्डवेयर पर ही हुई थी।
मेइतुआन का कहना है कि प्री-ट्रेनिंग के इस दौर में 50,000 से ज्यादा घरेलू एक्सेलेरेटर के क्लस्टर पर 35 ट्रिलियन से अधिक टोकन प्रोसेस हुए और यह पूरा काम "बिना किसी रोलबैक या नाकाबिल-ए-भरपाई लॉस स्पाइक" के पूरा हुआ। यह स्थिरता कोई छोटी बात नहीं, क्योंकि बिना आजमाए हार्डवेयर स्टैक पर बड़े ट्रेनिंग रन अक्सर बीच में ही ढह जाते हैं। यह उस बड़े रुझान से भी मेल खाता है जिसमें चीन अपने AI मॉडल ट्रेन करने के लिए अमेरिकी हार्डवेयर पर निर्भरता घटाने की कोशिश कर रहा है।
कीमत में छिपा है असली दांव
लेकिन इसका सबसे मजबूत पहलू है इसका बिल। स्टैंडर्ड API एक्सेस की कीमत 0.75 डॉलर प्रति मिलियन इनपुट टोकन और 2.95 डॉलर प्रति मिलियन आउटपुट टोकन है, जो मौजूदा लॉन्च ऑफर के दौरान घटकर 0.30 डॉलर और 1.20 डॉलर रह जाती है, और कैश्ड कॉन्टेक्स्ट से पढ़ना पूरी तरह मुफ्त है। यह GPT-5.5 की 5 डॉलर और 30 डॉलर प्रति मिलियन टोकन वाली दर से कहीं सस्ता है, क्लॉड सॉनेट 5 की शुरुआती 2 डॉलर और 10 डॉलर वाली दर को भी मात देता है, और डीपसीक V4-Pro की स्थायी 0.435 डॉलर व 0.87 डॉलर तथा शाओमी के MiMo-V2.5 Pro के करीब बैठता है, जो मई में अपनी कीमत घटाने के बाद उसी दर पर आ गया था।
सबसे भारी इस्तेमाल करने वालों के लिए इससे भी सस्ता रास्ता है। मेइतुआन टोकन पैक भी बेचता है, जिसमें 1 अरब टोकन का बंडल करीब 60 डॉलर में मिलता है। यही वजह है कि यह भारी मात्रा में कोड लिखने वाले प्रोग्रामर्स के लिए बेहद आकर्षक है।
असल काम में यह कैसा है
एक झटपट गेम बनाने वाले काम में लॉन्गकैट-2.0 ने काम पूरा कर दिया, और कुछ बार सुधार करने के बाद इसका आउटपुट ठीक-ठाक टिका रहा। तैयार नतीजा क्लॉड फेबल और क्लॉड ओपस 4.8 से साफ तौर पर नीचे रहा, जिससे इसे सॉनेट 4.6 के आसपास रखना आसान हो जाता है, फिर भी इन कीमतों पर हर डॉलर के बदले मिलने वाली क्वालिटी से बहस करना मुश्किल है।
गेम में इसने अलग-अलग कोणों से दुश्मनों की लहरें भेजीं, जबकि कैमरा अपने आप सबसे नजदीकी दुश्मन पर केंद्रित होता रहा। लेकिन जैसे ही मुश्किल बढ़ने के साथ दुश्मनों की संख्या बढ़ी, इसका लॉजिक गड़बड़ा गया। ज्यादा रफ्तार पर टारगेट बदलने का लॉजिक बेतरतीब हो गया, और टाइपिंग प्रॉम्प्ट के बीचोंबीच फोकस किसी नजदीकी दुश्मन पर छलांग लगा देता, जिससे गेम खेलना झुंझलाहट भरा हो जाता।
वाइब-कोडिंग सेशन में यह आम बात है, जहां मॉडल किसी फैसले के आगे के नतीजों का अंदाजा कम ही लगा पाते हैं और बस वही देते हैं जो प्रॉम्प्ट में शब्दश: मांगा गया हो। यही सस्ते मॉडल के पक्ष में सबसे बड़ी दलील भी है: कीमत जितनी कम, यूजर उतनी ही आजादी से बार-बार सुधार करता रह सकता है, जब तक नतीजा उसकी सोच से मेल न खा जाए। कुल मिलाकर, बिना किसी अतिरिक्त मदद के, झटपट कोडिंग कामों में इसकी क्वालिटी डीपसीक v4 Flash और डीपसीक v4 Pro के बीच कहीं ठहरती है।
अंदर की मशीनरी
लॉन्गकैट-2.0 आकार को बहुत बढ़ाए बिना खुद को तेज और ज्यादा सक्षम बनाने के लिए कई तरकीबों का सहारा लेता है। डीपसीक के डिजाइन पर बना इसका अटेंशन सिस्टम बहुत लंबी बातचीत के सिर्फ सबसे प्रासंगिक हिस्सों पर ध्यान देता है, न कि हर चीज को बराबर तवज्जो देता है, जिससे यह तेजी से जवाब दे पाता है।
इसमें एक नया एन-ग्राम एम्बेडिंग सिस्टम भी है, जो शब्दों या उप-शब्दों के समूहों को एक इकाई के रूप में समझने का तरीका है। यह मॉडल को ज्यादा कंपोनेंट जोड़े बिना करीब 100 गुना ज्यादा संभावित रूप देता है। असल में यह AI को अकेले शब्दों के बजाय आम मुहावरे और वाक्यांश पहचानना सिखाता है। "New," "York," और "City" को तीन अलग टुकड़ों की तरह पढ़ने के बजाय यह "न्यूयॉर्क सिटी" को एक ही सार्थक अवधारणा मान सकता है, जिससे मॉडल को भाषा की कहीं गहरी पकड़ मिलती है, वह भी आकार में बहुत बड़ा हुए बिना।
ट्रेनिंग के बाद मेइतुआन तीन विशेषज्ञ सिस्टम को जोड़ता है, एक टूल इस्तेमाल करने पर केंद्रित (एजेंट), एक समस्या हल करने पर (रीजनिंग), और एक बातचीत पर (इंटरैक्शन)। इसके बाद एक रूटिंग व्यवस्था तय करती है कि हर अनुरोध को इन विशेषज्ञों का कौन-सा मेल संभालेगा, ठीक वैसे ही जैसे सही काम सही टीम को सौंपा जाता है।
बेंचमार्क का लेखा-जोखा
SWE-bench Pro पर, जो मापता है कि कोई मॉडल प्रोडक्शन कोडबेस से लिए गए असली गिटहब इश्यू कितनी बार सुलझाता है, लॉन्गकैट-2.0 ने 59.5 अंक हासिल किए, जो GPT-5.5 के 58.6 और जेमिनी 3.1 प्रो के 54.2 से आगे हैं, हालांकि यह अब भी क्लॉड ओपस 4.7 और 4.8 से पीछे है। FORTE पर, जो 15 पेशों के रोजमर्रा के दफ्तरी कामों में एजेंट को 45 मिनट की समयसीमा के भीतर परखता है, इसने 73.2 अंक बनाए, जो क्लॉड ओपस 4.6 के बराबर हैं लेकिन GPT-5.5 के 77.8 से पीछे हैं।
किसे फायदा, और एक पेच
सबसे साफ फायदा उन टीमों को है जो कम बजट में कोडिंग एजेंट बना रही हैं, और उन सबको भी जो भारी मात्रा में रिपॉजिटरी-स्तर का काम चला रहे हैं, जहां मुफ्त कैश्ड-कॉन्टेक्स्ट रीड्स का फायदा बढ़ता जाता है। यह मॉडल अभी मेइतुआन के ओपनAI- और एंथ्रोपिक-कम्पैटिबल API एंडपॉइंट के जरिए, या हर्मीस, क्लॉड कोड और ओपनक्लॉ जैसे एजेंट हार्नेस के जरिए उपलब्ध है, जो इसे पहले ही जोड़ चुके हैं। इसके साथ 1M टोकन का कॉन्टेक्स्ट विंडो और इसका अपना लॉन्गकैट स्पार्स अटेंशन (LSA) भी आता है, जो उस दस लाख टोकन के दायरे में कुशलता से स्केल करता है।
एक तबका फिलहाल खाली हाथ है: वे लोग जो इसे खुद होस्ट करना चाहते हैं। गिटहब और हगिंग फेस, दोनों की रिपॉजिटरी पर अब भी लिखा है "मॉडल वेट्स जल्द आ रहे हैं", और मेइतुआन ने यह तारीख नहीं बताई कि ये फाइलें असल में कब आएंगी।













