ਨਵੀਂ ਦਿੱਲੀ, 5 ਅਪ੍ਰੈਲ
ਜਿਵੇਂ ਕਿ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ (ਏਆਈ) ਟਰਫ ਯੁੱਧ ਵਧਦਾ ਜਾ ਰਿਹਾ ਹੈ, ਐਲੋਨ ਮਸਕ ਦੀ ਮਲਕੀਅਤ ਵਾਲੇ ਗ੍ਰੋਕ ਅਤੇ ਚੀਨੀ ਡੀਪਸੀਕ ਮਾਡਲ ਹੁਣ ਏਆਈ ਸਮਰੱਥਾ ਦੇ ਮੋਹਰੀ ਸਥਾਨ 'ਤੇ ਖੜ੍ਹੇ ਹਨ - ਇੱਕ ਪਹੁੰਚਯੋਗਤਾ ਅਤੇ ਕੁਸ਼ਲਤਾ ਲਈ ਅਨੁਕੂਲਿਤ ਅਤੇ ਦੂਜਾ ਬਰੂਟ-ਫੋਰਸ ਸਕੇਲ ਲਈ - ਸਿਖਲਾਈ ਸਰੋਤਾਂ ਵਿੱਚ ਵਿਸ਼ਾਲ ਅਸਮਾਨਤਾ ਦੇ ਬਾਵਜੂਦ, ਸ਼ਨੀਵਾਰ ਨੂੰ ਇੱਕ ਰਿਪੋਰਟ ਵਿੱਚ ਦਿਖਾਇਆ ਗਿਆ।
ਗ੍ਰੋਕ-3 ਸਮਝੌਤਾ ਕੀਤੇ ਬਿਨਾਂ ਪੈਮਾਨੇ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ - 200,000 NVIDIA H100s ਫਰੰਟੀਅਰ ਲਾਭਾਂ ਦਾ ਪਿੱਛਾ ਕਰਦੇ ਹਨ, ਜਦੋਂ ਕਿ ਡੀਪਸੀਕ-R1 ਕੰਪਿਊਟ ਦੇ ਇੱਕ ਹਿੱਸੇ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਮਾਨ ਪ੍ਰਦਰਸ਼ਨ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਇਹ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ ਕਿ ਨਵੀਨਤਾਕਾਰੀ ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਕਿਊਰੇਸ਼ਨ ਬ੍ਰੂਟ ਫੋਰਸ ਦਾ ਮੁਕਾਬਲਾ ਕਰ ਸਕਦੇ ਹਨ, ਕਾਊਂਟਰਪੁਆਇੰਟ ਰਿਸਰਚ ਦੇ ਅਨੁਸਾਰ।
ਫਰਵਰੀ ਤੋਂ, ਡੀਪਸੀਕ ਨੇ ਦੁਨੀਆ ਦੇ ਫਰੰਟੀਅਰ ਰੀਜ਼ਨਿੰਗ ਮਾਡਲਾਂ ਦੇ ਬਰਾਬਰ ਪ੍ਰਦਰਸ਼ਨ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ ਆਪਣੇ ਫਲੈਗਸ਼ਿਪ ਰੀਜ਼ਨਿੰਗ ਮਾਡਲ ਡੀਪਸੀਕ-R1 ਨੂੰ ਓਪਨ-ਸੋਰਸ ਕਰਕੇ ਗਲੋਬਲ ਸੁਰਖੀਆਂ ਹਾਸਲ ਕੀਤੀਆਂ ਹਨ।
“ਇਸਨੂੰ ਸਿਰਫ਼ ਇਸਦੀਆਂ ਕੁਲੀਨ ਸਮਰੱਥਾਵਾਂ ਹੀ ਨਹੀਂ ਵੱਖਰਾ ਕਰਦੀਆਂ ਹਨ, ਸਗੋਂ ਇਹ ਤੱਥ ਕਿ ਇਸਨੂੰ ਸਿਰਫ਼ 2,000 NVIDIA H800 GPUs ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ - H100 ਦਾ ਇੱਕ ਛੋਟਾ-ਡਾਊਨ, ਨਿਰਯਾਤ-ਅਨੁਕੂਲ ਵਿਕਲਪ, ਇਸਦੀ ਪ੍ਰਾਪਤੀ ਨੂੰ ਕੁਸ਼ਲਤਾ ਵਿੱਚ ਇੱਕ ਮਾਸਟਰ ਕਲਾਸ ਬਣਾਉਂਦਾ ਹੈ,” ਕਾਊਂਟਰਪੁਆਇੰਟ ਵਿਖੇ AI ਦੇ ਪ੍ਰਮੁੱਖ ਵਿਸ਼ਲੇਸ਼ਕ ਵੇਈ ਸਨ ਨੇ ਕਿਹਾ।
ਮਸਕ ਦੇ xAI ਨੇ Grok-3 ਦਾ ਪਰਦਾਫਾਸ਼ ਕੀਤਾ ਹੈ, ਜੋ ਕਿ ਇਸਦਾ ਹੁਣ ਤੱਕ ਦਾ ਸਭ ਤੋਂ ਉੱਨਤ ਮਾਡਲ ਹੈ, ਜੋ DeepSeek-R1, OpenAI ਦੇ GPT-o1 ਅਤੇ Google ਦੇ Gemini 2 ਤੋਂ ਥੋੜ੍ਹਾ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ।
“DeepSeek-R1 ਦੇ ਉਲਟ, Grok-3 ਮਲਕੀਅਤ ਹੈ ਅਤੇ ਇਸਨੂੰ xAI ਦੇ ਸੁਪਰ ਕੰਪਿਊਟਰ ਕੋਲੋਸਸ 'ਤੇ 200,000 H100 GPUs ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ, ਜੋ ਕਿ ਕੰਪਿਊਟੇਸ਼ਨਲ ਪੈਮਾਨੇ ਵਿੱਚ ਇੱਕ ਵੱਡੀ ਛਾਲ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ,” ਸਨ ਨੇ ਕਿਹਾ।