दो महीने तक चुपचाप ओपनराउटर पर छाया रहा यह चीनी AI मॉडल, अब सामने आया मेइतुआन का लॉन्गकैट-2.0

मेइतुआन ने खुलासा किया है कि उसका 1.6 ट्रिलियन पैरामीटर वाला ओपन-लाइसेंस मॉडल लॉन्गकैट-2.0 ही वह गुमनाम "आउल अल्फा" है जो दो महीने तक ओपनराउटर की रैंकिंग में छाया रहा; पूरी तरह चीनी चिप पर बना यह मॉडल कीमत में प्रतिद्वंद्वियों को कड़ी टक्कर देता है।

माइकल एंडरसनअमेरिका संवाददाता 6 मिनट पढ़ें AI के लिए

चीनी टेक कंपनी मेइतुआन ने 30 जून को लॉन्गकैट-2.0 से पर्दा उठाया और इसके साथ ही यह पुष्टि हो गई कि ओपन-लाइसेंस वाला यह 1.6 ट्रिलियन पैरामीटर वाला मिक्सचर-ऑफ-एक्सपर्ट्स (MoE) मॉडल वही सिस्टम है जो पिछले दो महीने से ओपनराउटर पर आउल अल्फा के छद्म नाम से चुपचाप चल रहा था। हफ्तों तक डेवलपर्स इस पर असली काम चला रहे थे, बिना यह जाने कि इसे बनाया किसने है।

विशाल आकार, पर पूरा जोर एक बार में नहीं

पैरामीटर वे तमाम डायल होते हैं जिन्हें कोई मॉडल ट्रेनिंग के दौरान एडजस्ट कर सकता है, और लॉन्गकैट-2.0 में इनकी संख्या पूरे 1.6 ट्रिलियन है। लेकिन यह इन सबका इस्तेमाल एक साथ नहीं करता। हर टोकन (डेटा का सबसे छोटा टुकड़ा जिसे कोई AI पढ़ता है) के लिए मॉडल करीब 48 अरब पैरामीटर सक्रिय करता है, और यह आंकड़ा सवाल की कठिनाई के हिसाब से 33 अरब से 56 अरब के बीच घटता-बढ़ता रहता है। इतने बड़े मॉडल को व्यावहारिक रूप से तेज बनाए रखने की असली वजह यही चुनिंदा सक्रियता है।

दो महीने की गुमनामी रंग लाई

गुमनाम रहकर चलना फायदे का सौदा साबित हुआ। जब तक मेइतुआन ने इस पर अपना नाम लगाया, तब तक आउल अल्फा हर्मीस एजेंट वर्कस्पेस पर पहले नंबर पर पहुंच चुका था, क्लॉड कोड पर दूसरे और ओपनक्लॉ डिप्लॉयमेंट्स में तीसरे स्थान पर था। ये तीनों रैंकिंग मासिक कॉल वॉल्यूम के आधार पर तय हुईं। यानी लोग इसका मॉडल किसका है यह जानने से बहुत पहले ही अपने इस्तेमाल से इसके पक्ष में वोट दे रहे थे।

पूरी तरह चीनी चिप पर बना पहला ट्रिलियन-पैरामीटर मॉडल

इस लॉन्च को खास बनाती है इसकी जन्मस्थली। लॉन्गकैट-2.0 पहला ऐसा ट्रिलियन-पैरामीटर मॉडल है जिसकी ट्रेनिंग और तैनाती शुरू से आखिर तक घरेलू चीनी ASIC पर हुई है, न कि कहीं और ट्रेनिंग के बाद सिर्फ उन पर चलाया गया हो। डीपसीक के V4-Pro से इसका फर्क साफ है: वह मॉडल हुआवे की चिप का इस्तेमाल केवल इन्फरेंस के लिए करता था, जबकि उसकी प्री-ट्रेनिंग एनविडिया के हार्डवेयर पर ही हुई थी।

मेइतुआन का कहना है कि प्री-ट्रेनिंग के इस दौर में 50,000 से ज्यादा घरेलू एक्सेलेरेटर के क्लस्टर पर 35 ट्रिलियन से अधिक टोकन प्रोसेस हुए और यह पूरा काम "बिना किसी रोलबैक या नाकाबिल-ए-भरपाई लॉस स्पाइक" के पूरा हुआ। यह स्थिरता कोई छोटी बात नहीं, क्योंकि बिना आजमाए हार्डवेयर स्टैक पर बड़े ट्रेनिंग रन अक्सर बीच में ही ढह जाते हैं। यह उस बड़े रुझान से भी मेल खाता है जिसमें चीन अपने AI मॉडल ट्रेन करने के लिए अमेरिकी हार्डवेयर पर निर्भरता घटाने की कोशिश कर रहा है।

कीमत में छिपा है असली दांव

लेकिन इसका सबसे मजबूत पहलू है इसका बिल। स्टैंडर्ड API एक्सेस की कीमत 0.75 डॉलर प्रति मिलियन इनपुट टोकन और 2.95 डॉलर प्रति मिलियन आउटपुट टोकन है, जो मौजूदा लॉन्च ऑफर के दौरान घटकर 0.30 डॉलर और 1.20 डॉलर रह जाती है, और कैश्ड कॉन्टेक्स्ट से पढ़ना पूरी तरह मुफ्त है। यह GPT-5.5 की 5 डॉलर और 30 डॉलर प्रति मिलियन टोकन वाली दर से कहीं सस्ता है, क्लॉड सॉनेट 5 की शुरुआती 2 डॉलर और 10 डॉलर वाली दर को भी मात देता है, और डीपसीक V4-Pro की स्थायी 0.435 डॉलर व 0.87 डॉलर तथा शाओमी के MiMo-V2.5 Pro के करीब बैठता है, जो मई में अपनी कीमत घटाने के बाद उसी दर पर आ गया था।

सबसे भारी इस्तेमाल करने वालों के लिए इससे भी सस्ता रास्ता है। मेइतुआन टोकन पैक भी बेचता है, जिसमें 1 अरब टोकन का बंडल करीब 60 डॉलर में मिलता है। यही वजह है कि यह भारी मात्रा में कोड लिखने वाले प्रोग्रामर्स के लिए बेहद आकर्षक है।

असल काम में यह कैसा है

एक झटपट गेम बनाने वाले काम में लॉन्गकैट-2.0 ने काम पूरा कर दिया, और कुछ बार सुधार करने के बाद इसका आउटपुट ठीक-ठाक टिका रहा। तैयार नतीजा क्लॉड फेबल और क्लॉड ओपस 4.8 से साफ तौर पर नीचे रहा, जिससे इसे सॉनेट 4.6 के आसपास रखना आसान हो जाता है, फिर भी इन कीमतों पर हर डॉलर के बदले मिलने वाली क्वालिटी से बहस करना मुश्किल है।

गेम में इसने अलग-अलग कोणों से दुश्मनों की लहरें भेजीं, जबकि कैमरा अपने आप सबसे नजदीकी दुश्मन पर केंद्रित होता रहा। लेकिन जैसे ही मुश्किल बढ़ने के साथ दुश्मनों की संख्या बढ़ी, इसका लॉजिक गड़बड़ा गया। ज्यादा रफ्तार पर टारगेट बदलने का लॉजिक बेतरतीब हो गया, और टाइपिंग प्रॉम्प्ट के बीचोंबीच फोकस किसी नजदीकी दुश्मन पर छलांग लगा देता, जिससे गेम खेलना झुंझलाहट भरा हो जाता।

वाइब-कोडिंग सेशन में यह आम बात है, जहां मॉडल किसी फैसले के आगे के नतीजों का अंदाजा कम ही लगा पाते हैं और बस वही देते हैं जो प्रॉम्प्ट में शब्दश: मांगा गया हो। यही सस्ते मॉडल के पक्ष में सबसे बड़ी दलील भी है: कीमत जितनी कम, यूजर उतनी ही आजादी से बार-बार सुधार करता रह सकता है, जब तक नतीजा उसकी सोच से मेल न खा जाए। कुल मिलाकर, बिना किसी अतिरिक्त मदद के, झटपट कोडिंग कामों में इसकी क्वालिटी डीपसीक v4 Flash और डीपसीक v4 Pro के बीच कहीं ठहरती है।

अंदर की मशीनरी

लॉन्गकैट-2.0 आकार को बहुत बढ़ाए बिना खुद को तेज और ज्यादा सक्षम बनाने के लिए कई तरकीबों का सहारा लेता है। डीपसीक के डिजाइन पर बना इसका अटेंशन सिस्टम बहुत लंबी बातचीत के सिर्फ सबसे प्रासंगिक हिस्सों पर ध्यान देता है, न कि हर चीज को बराबर तवज्जो देता है, जिससे यह तेजी से जवाब दे पाता है।

इसमें एक नया एन-ग्राम एम्बेडिंग सिस्टम भी है, जो शब्दों या उप-शब्दों के समूहों को एक इकाई के रूप में समझने का तरीका है। यह मॉडल को ज्यादा कंपोनेंट जोड़े बिना करीब 100 गुना ज्यादा संभावित रूप देता है। असल में यह AI को अकेले शब्दों के बजाय आम मुहावरे और वाक्यांश पहचानना सिखाता है। "New," "York," और "City" को तीन अलग टुकड़ों की तरह पढ़ने के बजाय यह "न्यूयॉर्क सिटी" को एक ही सार्थक अवधारणा मान सकता है, जिससे मॉडल को भाषा की कहीं गहरी पकड़ मिलती है, वह भी आकार में बहुत बड़ा हुए बिना।

ट्रेनिंग के बाद मेइतुआन तीन विशेषज्ञ सिस्टम को जोड़ता है, एक टूल इस्तेमाल करने पर केंद्रित (एजेंट), एक समस्या हल करने पर (रीजनिंग), और एक बातचीत पर (इंटरैक्शन)। इसके बाद एक रूटिंग व्यवस्था तय करती है कि हर अनुरोध को इन विशेषज्ञों का कौन-सा मेल संभालेगा, ठीक वैसे ही जैसे सही काम सही टीम को सौंपा जाता है।

बेंचमार्क का लेखा-जोखा

SWE-bench Pro पर, जो मापता है कि कोई मॉडल प्रोडक्शन कोडबेस से लिए गए असली गिटहब इश्यू कितनी बार सुलझाता है, लॉन्गकैट-2.0 ने 59.5 अंक हासिल किए, जो GPT-5.5 के 58.6 और जेमिनी 3.1 प्रो के 54.2 से आगे हैं, हालांकि यह अब भी क्लॉड ओपस 4.7 और 4.8 से पीछे है। FORTE पर, जो 15 पेशों के रोजमर्रा के दफ्तरी कामों में एजेंट को 45 मिनट की समयसीमा के भीतर परखता है, इसने 73.2 अंक बनाए, जो क्लॉड ओपस 4.6 के बराबर हैं लेकिन GPT-5.5 के 77.8 से पीछे हैं।

किसे फायदा, और एक पेच

सबसे साफ फायदा उन टीमों को है जो कम बजट में कोडिंग एजेंट बना रही हैं, और उन सबको भी जो भारी मात्रा में रिपॉजिटरी-स्तर का काम चला रहे हैं, जहां मुफ्त कैश्ड-कॉन्टेक्स्ट रीड्स का फायदा बढ़ता जाता है। यह मॉडल अभी मेइतुआन के ओपनAI- और एंथ्रोपिक-कम्पैटिबल API एंडपॉइंट के जरिए, या हर्मीस, क्लॉड कोड और ओपनक्लॉ जैसे एजेंट हार्नेस के जरिए उपलब्ध है, जो इसे पहले ही जोड़ चुके हैं। इसके साथ 1M टोकन का कॉन्टेक्स्ट विंडो और इसका अपना लॉन्गकैट स्पार्स अटेंशन (LSA) भी आता है, जो उस दस लाख टोकन के दायरे में कुशलता से स्केल करता है।

एक तबका फिलहाल खाली हाथ है: वे लोग जो इसे खुद होस्ट करना चाहते हैं। गिटहब और हगिंग फेस, दोनों की रिपॉजिटरी पर अब भी लिखा है "मॉडल वेट्स जल्द आ रहे हैं", और मेइतुआन ने यह तारीख नहीं बताई कि ये फाइलें असल में कब आएंगी।

इसका आप पर असर

कम बजट वाले डेवलपर्स के लिए: बेहद सस्ता API (लॉन्च ऑफर में 0.30 डॉलर इनपुट और 1.20 डॉलर आउटपुट प्रति मिलियन टोकन, कैश्ड रीड्स मुफ्त) कोडिंग एजेंट चलाने की लागत काफी घटा देता है।
भारी इस्तेमाल करने वालों के लिए: 1 अरब टोकन का पैक करीब 60 डॉलर में मिलने से बड़े पैमाने पर रिपॉजिटरी-स्तर का काम और सस्ता पड़ता है।
खुद होस्ट करने वालों के लिए: अभी मॉडल वेट्स डाउनलोड नहीं हो सकते, गिटहब और हगिंग फेस पर सिर्फ "जल्द आ रहे हैं" लिखा है और कोई तारीख तय नहीं।

सवाल-जवाब

लॉन्गकैट-2.0 क्या है?

यह मेइतुआन का 1.6 ट्रिलियन पैरामीटर वाला ओपन-लाइसेंस मिक्सचर-ऑफ-एक्सपर्ट्स AI मॉडल है, जिसे 30 जून को पेश किया गया।

आउल अल्फा क्या था?

यह वही छद्म नाम था जिसके तहत यह मॉडल दो महीने तक ओपनराउटर पर गुमनाम रूप से चलता रहा।

इसकी कीमत कितनी है?

स्टैंडर्ड दर 0.75 डॉलर इनपुट और 2.95 डॉलर आउटपुट प्रति मिलियन टोकन है, जो लॉन्च ऑफर में 0.30 और 1.20 डॉलर रह जाती है; कैश्ड रीड्स मुफ्त हैं और 1 अरब टोकन का पैक करीब 60 डॉलर में मिलता है।

इसे किन चिप्स पर ट्रेन किया गया?

यह पूरी तरह घरेलू चीनी ASIC पर शुरू से आखिर तक ट्रेन और तैनात होने वाला पहला ट्रिलियन-पैरामीटर मॉडल है; इसमें 50,000 से ज्यादा एक्सेलेरेटर और 35 ट्रिलियन से अधिक टोकन इस्तेमाल हुए।

बेंचमार्क पर इसका प्रदर्शन कैसा है?

SWE-bench Pro पर इसने 59.5 और FORTE पर 73.2 अंक हासिल किए।

क्या इसे खुद होस्ट किया जा सकता है?

अभी नहीं। गिटहब और हगिंग फेस पर मॉडल वेट्स के लिए "जल्द आ रहे हैं" लिखा है और कोई तारीख नहीं दी गई।

GPT-5.5 के मुकाबले कीमत में यह कहां ठहरता है?

यह काफी सस्ता है, जबकि GPT-5.5 की दर 5 डॉलर इनपुट और 30 डॉलर आउटपुट प्रति मिलियन टोकन है।

लेखक के बारे मेंमाइकल एंडरसनअमेरिका संवाददाता सैन फ्रांसिस्को

विशेषज्ञताअमेरिका समाचार, राजनीति, सरकारी नीति, चुनाव, अर्थव्यवस्था, ब्रेकिंग न्यूज़, कांग्रेस, व्हाइट हाउस, सामाजिक मुद्दे, अंतरराष्ट्रीय संबंध

माइकल एंडरसन एक अमेरिका संवाददाता हैं जो अमेरिकी राजनीति, ब्रेकिंग न्यूज़, अर्थव्यवस्था और राष्ट्रीय मामलों को कवर करते हैं। वे पूरे अमेरिका से समय पर अपडेट और स्पष्ट विश्लेषण देते हैं।

माइकल एंडरसन एक अमेरिका संवाददाता हैं जो अमेरिकी राजनीति, सरकारी नीति, अर्थव्यवस्था, सामाजिक मुद्दों और बड़ी ब्रेकिंग ख़बरों की कवरेज में विशेषज्ञता रखते हैं। वे वॉशिंगटन डी.सी. और पूरे अमेरिका के घटनाक्रमों — चुनाव, कांग्रेस की गतिविधियाँ, व्हाइट हाउस के फ़ैसले, आर्थिक रुझान और अहम राष्ट्रीय ख़बरों — पर रिपोर्ट करते हैं। सटीकता, गति और संदर्भ-सहित रिपोर्टिंग पर ज़ोर देते हुए माइकल अमेरिका और उसके वैश्विक प्रभाव को आकार देने वाले मुद्दों का गहन विश्लेषण देते हैं। उनकी पत्रकारिता पाठकों को स्पष्ट, तथ्यपरक और संतुलित रिपोर्टिंग के ज़रिए जटिल राजनीतिक व आर्थिक घटनाक्रम समझने में मदद करती है।

पूरा प्रोफ़ाइल देखें ↗