DeepSeek: Το AI μοντέλο τροφοδοτείται από επεξεργαστές Huawei!

Η DeepSeek είναι το πιο καυτό θέμα των τελευταίων ημερών στον κόσμο της Τεχνολογίας, καθώς το κινέζικο AI μοντέλο έχει αναστατώσει για τα καλά τη Δύση με τις επιδόσεις και την σημαντικά οικονομικότερη διαδικασία εκπαίδευσης του.

Ήδη, βέβαια, εκφράζονται ανησυχίες για την διαχείριση των προσωπικών δεδομένων των χρηστών και η OpenAI τόλμησε να κατηγορήσει την DeepSeek ότι «άρμεξε» το ChatGPT για να τα καταφέρει (σ.σ. λες και η ίδια πορεύθηκε με τον σταυρό στο χέρι...), αλλά αυτό που δεν αμφισβητεί κανείς είναι ότι οι Κινέζοι τα κατάφεραν χωρίς να έχουν πρόσβαση στα πιο προηγμένα chips λόγω των κυρώσεων που έχει επιβάλει η αμερικάνική κυβέρνηση.

Εδώ να υπενθυμίσουμε ότι οι ερευνητές της Apple για τον τομέα της AI έχουν αποκαλύψει τον τρόπο με τον οποίο τα κατάφερε η DeepSeek, ενώ τώρα μαθαίνουμε από τον αναλυτή Alexander Doria περισσότερα σχετικά με την υπολογιστή δύναμη που υποστήριξη το όλο εγχείρημα. Απ' ό,τι φαίνεται, η DeepSeek βασίστηκε στα chipsets της Huawei (Ascend 910C)!

Ο Doria δηλώνει ότι η DeepSeek ενδέχεται να εκπαιδεύσει το επόμενο μοντέλο AI (V4) χρησιμοποιώντας 32.000 επεξεργαστές Huawei Ascend 910C. Ωστόσο, μένει να δούμε πώς ο κατασκευαστής τσιπ θα ανταποκριθεί σε αυτή τη ζήτηση. Να σημειωθεί, πάντως, ότι το επόμενο Huawei Ascend 920c chipset στοχεύει να επιτύχει την απόδοση της σημερινής ναυαρχίδας της Nvidia, το B200.

Το DeepSeek R1 είναι ένα μοντέλο συλλογισμού που βασίζεται στο μοντέλο μεγάλης γλώσσας V3 και υποστηρίζεται ότι αναπτύχθηκε με ένα κλάσμα του κόστους - κάτω από 6 εκατομμύρια δολάρια για την εκπαίδευση του μοντέλου του. Σε σύγκριση με αμερικανικές μάρκες όπως η ChatGPT που ξόδεψαν εκατομμύρια δολάρια για να δημιουργήσουν σχεδόν την ίδια εμπειρία AI.

I feel this should be a much bigger story: DeepSeek has trained on Nvidia H800 but is running inference on the new home Chinese chips made by Huawei, the 910C. pic.twitter.com/6IAgQlQ3ou
— Alexander Doria (@Dorialexander) January 28, 2025