व्यवसाय

Apple के शोधकर्ता गणित में AI की तर्क क्षमता पर सवाल उठाते हैं

October 12, 2024

नई दिल्ली, 12 अक्टूबर

Apple शोधकर्ताओं की एक टीम ने विशेष रूप से गणित में बड़े भाषा मॉडल (एलएलएम) की औपचारिक तर्क क्षमताओं पर सवाल उठाया है।

उन्होंने पाया कि एलएलएम एक ही प्रश्न के विभिन्न तात्कालिकताओं का उत्तर देते समय ध्यान देने योग्य भिन्नता प्रदर्शित करते हैं।

साहित्य सुझाव देता है कि एलएलएम में तर्क प्रक्रिया औपचारिक तर्क के बजाय संभाव्य पैटर्न-मिलान है।

यद्यपि एलएलएम अधिक अमूर्त तर्क पैटर्न से मेल खा सकते हैं, लेकिन वे सच्चे तार्किक तर्क से कम हैं। इनपुट टोकन में छोटे बदलाव मॉडल आउटपुट में भारी बदलाव ला सकते हैं, जो एक मजबूत टोकन पूर्वाग्रह का संकेत देता है और सुझाव देता है कि ये मॉडल अत्यधिक संवेदनशील और नाजुक हैं।

"इसके अतिरिक्त, कई टोकन के सही चयन की आवश्यकता वाले कार्यों में, सटीक उत्तर पर पहुंचने की संभावना टोकन या चरणों की संख्या के साथ तेजी से घट जाती है, जो जटिल तर्क परिदृश्यों में उनकी अंतर्निहित अविश्वसनीयता को रेखांकित करती है," ऐप्पल के शोधकर्ताओं ने अपने पेपर में कहा। जीएसएम-प्रतीकात्मक: बड़े भाषा मॉडल में गणितीय तर्क की सीमाओं को समझना।

ग्रेड-स्कूल स्तर के प्रश्नों पर मॉडल के गणितीय तर्क का आकलन करने के लिए 'जीएसएम8के' बेंचमार्क का व्यापक रूप से उपयोग किया जाता है।

जबकि GSM8K पर एलएलएम के प्रदर्शन में हाल के वर्षों में काफी सुधार हुआ है, यह स्पष्ट नहीं है कि उनकी गणितीय तर्क क्षमताएं वास्तव में उन्नत हुई हैं या नहीं, जिससे रिपोर्ट किए गए मेट्रिक्स की विश्वसनीयता पर सवाल उठ रहे हैं।

 

ਕੁਝ ਕਹਿਣਾ ਹੋ? ਆਪਣੀ ਰਾਏ ਪੋਸਟ ਕਰੋ

 

और ख़बरें

श्रमिक हड़ताल के बाद रेनॉल्ट कोरिया और यूनियन वेतन समझौते पर पहुंचे

श्रमिक हड़ताल के बाद रेनॉल्ट कोरिया और यूनियन वेतन समझौते पर पहुंचे

हास के साथ बहु-वर्षीय तकनीकी साझेदारी में टोयोटा की F1 में वापसी

हास के साथ बहु-वर्षीय तकनीकी साझेदारी में टोयोटा की F1 में वापसी

भारत में डीमैट खाते बढ़कर 175 मिलियन हो गए, एनएसई पर सक्रिय ग्राहक 47.9 मिलियन तक पहुंच गए

भारत में डीमैट खाते बढ़कर 175 मिलियन हो गए, एनएसई पर सक्रिय ग्राहक 47.9 मिलियन तक पहुंच गए

एलोन मस्क ने टेस्ला के पहले साइबरकैब, रोबोवन और भविष्य के रोबोट का अनावरण किया

एलोन मस्क ने टेस्ला के पहले साइबरकैब, रोबोवन और भविष्य के रोबोट का अनावरण किया

भारत के समावेशी विकास के लिए आधुनिक तकनीक को अपनाने का समय: स्टार्टअप संस्थापक

भारत के समावेशी विकास के लिए आधुनिक तकनीक को अपनाने का समय: स्टार्टअप संस्थापक

वैश्विक मंदी के बावजूद वित्त वर्ष 25 में भारत का फार्मा, मेडिटेक निर्यात बढ़कर चौथे सबसे बड़े निर्यात पर पहुंच गया

वैश्विक मंदी के बावजूद वित्त वर्ष 25 में भारत का फार्मा, मेडिटेक निर्यात बढ़कर चौथे सबसे बड़े निर्यात पर पहुंच गया

भारत के ग्रामीण परिवारों में वाहन बीमा, पेंशन कवरेज बढ़ा

भारत के ग्रामीण परिवारों में वाहन बीमा, पेंशन कवरेज बढ़ा

सितंबर में भारतीय एमएफ उद्योग की औसत प्रबंधन अधीन संपत्ति 2.97 प्रतिशत बढ़ी

सितंबर में भारतीय एमएफ उद्योग की औसत प्रबंधन अधीन संपत्ति 2.97 प्रतिशत बढ़ी

भारत के त्योहारी सीजन में 35 मिलियन स्मार्टफोन की बिक्री होने की संभावना, सैमसंग, एप्पल आगे

भारत के त्योहारी सीजन में 35 मिलियन स्मार्टफोन की बिक्री होने की संभावना, सैमसंग, एप्पल आगे

भारत का कपड़ा क्षेत्र 2030 तक 350 अरब डॉलर तक पहुंचने का अनुमान: केंद्र

भारत का कपड़ा क्षेत्र 2030 तक 350 अरब डॉलर तक पहुंचने का अनुमान: केंद्र

  --%>