Äúµ±Ç°µÄλÖ㺸ֲĠ> Ð͸֠> Êг¡·ÖÎö

¹ú²ú°ëµ¼Ìå¼¼Êõ£¬¹ú²ú°ëµ¼ÌåÉè±¸Í»ÆÆ

À´Ô´:Í·Ìõ ×÷Õß: chanong
·ÖÏíµ½
¹Ø×¢µÂÇÚ¸ÖÌúÍøÔÚÏߣº
  • ɨÃè¶þάÂë

    ¹Ø×¢¡Ì

    µÂÇÚ¸ÖÌúÍøÎ¢ÐÅ

ÔÚÏß×Éѯ£º
  • ɨÃè»òµã»÷¹Ø×¢µÂÇÚ¸ÖÌúÍøÔÚÏ߿ͷþ

£¨±¨¸æ×«Ð´/×÷ÕߣºÖÐ̩֤ȯ¡¢Íõ·¼¡¢ÑîÐñ¡¢ÀîÑ©·å£©

1.´óÐÍ»úÐÍ·¢Õ¹½«¹ÄÀøÓ²¼þÉý¼¶£¬ÐèÇóºÍÕþ²ß½«¹ÄÀø¹ú²úÌæ´ú1.1.¹ú²ú¼ÆËãÄÜÁ¦´ó£¬¹ú²ú»¯Âʵͣ¬¿Õ¼ä¹ãÀ«£¬¼ÆËãÄÜÁ¦ÓÐÏÞ£¬ÊÇδÀ´¾­¼Ã·¢Õ¹µÄ»ù´¡¡£¼ÆËãÄÜÁ¦¶Ô¹úÃñ¾­¼ÃµÄ·¢Õ¹Ó°ÏìºÜ´ó¡£¸ù¾ÝIDC ¡¶2021- 2022 È«Çò¼ÆËãÁ¦Ö¸ÊýÆÀ¹À±¨¸æ¡·Êý¾Ý£¬Æ½¾ùËãÁ¦Ã¿Ìá¸ßÒ»µã£¬Êý×Ö¾­¼ÃºÍGDP·Ö±ðÔö³¤3.5%ºÍ1.8%¡£ËãÁ¦×÷ΪÊý×Ö¾­¼Ãʱ´úµÄ¹Ø¼üÉú²úÁ¦ÒªËØ£¬ÒѳÉΪÊý×Ö¾­¼Ã·¢Õ¹µÄºËÐÄÖ§³ÅºÍÇý¶¯Á¦¡£µ±Ò»¸ö¹ú¼ÒµÄ¼ÆËãÄÜÁ¦Ö¸Êý´ïµ½40/60·Ö»ò¸ü¸ßʱ£¬GDPÔö³¤µÄÍÆ¶¯Á¦½«Ôö¼Ó1.5/3±¶¡£´ÓÏÂÓÎϸ·ÖÀ´¿´£¬È˹¤ÖÇÄܼÆËãºÍ±ßÔµ¼ÆËãÊÇÊг¡Ôö³¤µÄ¹Ø¼üÇý¶¯Á¦£¬½«ÒýÁìËãÁ¦ÊµÏÖеĿìËÙÔö³¤¡£ÎÒ¹úËãÁ¦Êг¡¿Õ¼ä¾Þ´ó£¬¹ú²ú»¯ÂÊÓÐÍû¿ìËÙÌáÉý¡£Õþ²ß·½Ã棬ÎÒ¹úÏȺ󷢲¼ÁË¡¶È«¹úÒ»Ì廯´óÊý¾ÝÖÐÐÄЭͬ´´ÐÂÌåϵËãÁ¦ÊàŦʵʩ·½°¸¡·¡¢¡¶ËãÁ¦»ù ´¡ÉèÊ©¸ßÖÊÁ¿·¢Õ¹Ðж¯¼Æ»®¡·¡¢¡¶¡°Ê®ËÄÎ塱Êý×Ö¾­¼Ã·¢Õ¹¹æ»®¡·µÈһϵÁÐÎļþÍÆ¶¯¼ÆËã»ù´¡ÉèÊ©½¨Éè¡£´ËÍ⣬¹ú¼ÒÕýÔÚ¶àµØÍÆ½øÖÇÄܼÆËãÖÐÐĽ¨É裬Öð²½Óɶ«ÏòÎ÷À©Õ¹¡£Ä¿Ç°£¬ÎÒ¹úÒÑÓÐ30¶à¸ö³ÇÊÐÕýÔÚ½¨Éè»òÄ⽨ÖÇÄܼÆËãÖÐÐÄ¡£´ËÍ⣬¸ù¾Ý¿Æ¼¼²¿·¢²¼µÄÕþ²ßÒªÇ󣬡°ÔÚ»ìºÏ²¿ÊðµÄ¹«¹²ËãÁ¦Æ½Ì¨ÖУ¬¹ú²úоƬÌṩµÄËãÁ¦¼ÛÖµÃûÒåÉϳ¬¹ý60%£¬¹ú²ú¿ª·¢¿ò¼ÜÓ¦ÓÅÏÈ¿¼ÂÇ¡±¡£¿¼Âǵ½AIоƬµÄʹÓã¬Ê¹ÓÃÂÊÒª´ïµ½60%ÒÔÉÏ¡£¡±¹úÄÚAIÉøÍ¸ÂÊÓÐÍû¿ìËÙÌáÉý¡£ IDCÊý¾ÝÏÔʾ£¬Î´À´ÎÒ¹úÖÇÄܼÆËãÄÜÁ¦½«¿ìËÙÔö³¤£¬2021ÄêÖÁ2026ÄêÎÒ¹úÖÇÄܼÆËãÄÜÁ¦Ä긴ºÏÔö³¤ÂÊÔ¤¼Æ½«´ïµ½52.3%¡£ FLOPS£¨Floating Point Operations Per Second£©ÊÇÿÃ븡µãÔËËãµÄ´ÎÊý£¬´ú±í¸¡µãÔËËãµÄËÙ¶È¡£¸¡µã¼ÆÊýʹÓø¡µãÊýʹÓò»Í¬³¤¶ÈµÄ¶þ½øÖÆÊý×ÖÀ´±íʾÊý×Ö¡£Ò»°ãÓÃ4¸ö×Ö½Ú£¬¼´32λµÄ¶þ½øÖÆÊýÀ´±íʾÊý×Ö¡£Òò´Ë£¬FP32/FP64/FP16·Ö±ð´ú±íµ¥¾«¶È¡¢Ë«¾«¶È¡¢°ë¾«¶È¡£ FP64³£ÓÃÓÚÐèÒª¸ß¾«¶ÈµÄ¿ÆÑ§¼ÆËãºÍ³¬¼¶¼ÆË㣬FP32ºÍFP16Ö÷ÒªÓÃÓÚAIÉî¶Èѧ**¡£

TF32ÊÇNVIDIAÌá³öµÄÌæ´úFP32µÄµ¥¾«¶È¸¡µã¸ñʽ¡£ TF32 (TensorFlow32) ÊÇNVIDIA A100 Ampere ¼Ü¹¹GPU ÉϵÄÒ»ÖÖÐÂÊý¾ÝÀàÐÍ£¬ËüʹÓÃÓë°ë¾«¶È(FP16) ÔËËãÏàͬµÄ10 λβÊý¾«¶È¡£Õâ¸ö¾«¶ÈˮƽԶԶ³¬¹ýÁËÈ˹¤ÖÇÄܹ¤×÷¸ºÔصľ«¶ÈÒªÇó¡£Í¬Ê±£¬TF32²ÉÓÃÓëFP32ÏàͬµÄ8λָÊý룬¿ÉÒÔÖ§³ÖÓëFP32ÏàͬµÄÊý×Ö·¶Î§£¬ÔÚÐÔÄÜ¡¢·¶Î§ºÍ¾«¶ÈÖ®¼äÌṩÁËÁ¼ºÃµÄƽºâ¡£ NVIDIA API ¿âÔÊÐíÓû§ÔÚÆäÓ¦ÓóÌÐòÖгä·ÖÀûÓÃTF32£¬¶øÎÞÐè½øÐÐÈκδúÂë¸ü¸Ä¡£ TF32 Tensor Core »ùÓÚFP32 ÊäÈëÖ´ÐмÆËã²¢Éú³ÉFP32 ¸ñʽµÄ½á¹û¡£Í¨¹ý½µµÍ¾«¶È£¬TF32 ÖÐеĵ¥¾«¶ÈÊý¾ÝÀàÐÍÈ¡´úÁËFP32 ÖÐԭʼµÄµ¥¾«¶ÈÊý¾ÝÀàÐÍ¡£Õâ¼õÉÙÁËÊý¾ÝÕ¼ÓõĿռ䣬²¢ÔÚÏàͬµÄÓ²¼þÌõ¼þÏÂÔÊÐí¸ü¶à¡¢¸ü¿ìµÄ²Ù×÷¡£ 2024ÄêÖÁ2025Ä꣬ÎÒ¹úËãÁ¦¹æ»®ÔöËÙ½«³¬¹ý100EFLOPS£¬Ï൱ÓÚAIËãÁ¦Ð¾Æ¬Êг¡¹æÄ£³¬¹ý2600ÒÚÔª¡£ 2023Äê10Ô£¬³ÉÁ¢¹¤ÒµºÍÐÅÏ¢»¯²¿¡¢ÖÐÑëÍøÐŰ졢½ÌÓý²¿¡¢¹ú¼ÒÎÀÉú½¡¿µÎ¯¡¢ÖйúÈËÃñÒøÐС¢¹ú×ÊίµÈ6¸ö²¿ÃÅ£¬Ìá³ö·¢Õ¹Á¿»¯Ö¸±êµ½2025Ä꣬Õë¶ÔËãÁ¦¡¢´æ´¢ÄÜÁ¦¡¢´æ´¢ÄÜÁ¦¡¢Ó¦ÓÃÔöÇ¿Ëĸö·½Ã棬Ìá³ö¡°µ½2025Ä꣬ÎÒ¹ú¼ÆËãÄÜÁ¦¹æÄ£´ïµ½300EFLOPS¡±¡¢¡°ÖÇÄܼÆËãÄÜÁ¦±ÈÖØ´ïµ½35%¡±¡£¾Ý¹¤ÒµºÍÐÅÏ¢»¯²¿²¿³¤½ð׳Áú½éÉÜ£¬8ÔÂ23ÈÕ£¬È«¹ú¼ÆËãÄÜÁ¦×ܹæÄ£´ïµ½197EFLOPS¡£¼ÙÉèδÀ´Á½ÄêÎÒ¹úËãÁ¦Ôö³¤Õ¼ÖÇÄÜËãÁ¦µÄ50%£¬¶ÔÓ¦µÄFP32ËãÁ¦Ï൱ÓÚ256Íò¿ÅA100×óÓÒ£¬Êг¡¹æÄ£Îª2600ÒÚ£¬Ô¤¼Æ³¬¹ýÔ­À´µÄ¡£ÎÒ¹úAIоƬÊг¡Ô¼Õ¼È«ÇòÊг¡µÄÈý·ÖÖ®Ò»¡£ÎÒ¹ú°ëµ¼Ìå²úÒµµÄÌØµãÊÇÊг¡¹æÄ£´ó¡¢¹ú²ú»¯Âʵͣ¬ÆäÖÐÒԸ߶ËÊý×ÖоƬ×îΪµäÐÍ¡£×ÜÌåÀ´¿´£¬¾ÝÆæÆæ×Éѯͳ¼Æ£¬ÖйúAIоƬÊг¡Ô¼Õ¼È«ÇòAIÊг¡µÄ30%ÖÁ40%£¬¶øÓ¢Î°´ïÊÇÈ«ÇòÁìÏȵÄGPU³§ÉÌ¡£ÒÔÆä²Æ±¨ÎªÀý£¬ÎÒ¹úÊÇNVIDIAµÄÖ÷ÒªÊÕÈëÀ´Ô´¡£ NVIDIA 2023 ²ÆÄêÖйú´ó½ӪҵÀûÈó´ïµ½58 ÒÚÃÀÔª£¬Õ¼×ÜÊÕÈëµÄ21.45%£¬¶ø2003 ²ÆÄ꣬Öйú´ó½ӪҵÀûÈó½öΪ2.4 ÒÚÃÀÔª£¬Õ¼×ÜÊÕÈëµÄ13%¡£Ëæ×ÅÎÒ¹úÈ˹¤ÖÇÄܲúÒµµÄ²»¶Ï·¢Õ¹ºÍÓ¦Óó¡¾°µÄ²»¶ÏÍØÕ¹£¬ÎÒÃÇÏàÐÅδÀ´¹úÄÚAIоƬÊг¡½«³ÖÐøÔö³¤¡£ GPUÊг¡µÄÂí̫ЧӦ¾Þ´ó£¬Ä¿Ç°ÎÒ¹ú¹ú²ú»¯ÂÊ»¹²»µ½10%¡£ÓÉÓÚÎÒ¹úоƬ²úÒµÆð²½½ÏÂý£¬¸ß¶ËоƬµÄ¼¼ÊõÍ»ÆÆÎÞ·¨Í¨¹ý¼òµ¥µÄ»ýÀÛÀ´ÊµÏÖ£¬Ä¿Ç°¹úÄÚоƬ¼¼ÊõÔ¶Ô¶ÂäºóÓÚÃÀ¹ú£¬Ôڸ߶ËоƬÁìÓòµÄÊг¡·Ý¶îµÍµÄ¡£´ÓÈ«Çò·¶Î§À´¿´£¬¾Ý»ª¾§²úÒµÑо¿ÔºÍ³¼Æ£¬NVIDIAÔÚ¶ÀÁ¢GPU¾ºÕùÊг¡ÉÏ´¦ÓÚ¢¶ÏµØÎ»£¬Êг¡·Ý¶î¸ß´ï88%£¬Âí̫ЧӦÏÔ×Å¡£´Ó¹úÄÚGPUÊг¡µ½ÔÆÐã×ʱ¾£º010 -30000 ͳ¼ÆÏÔʾ£¬¹úÄÚGPUÊг¡ËäÈ»¾Þ´ó£¬µ«Ä¿Ç°¹ú²ú»¯Âʲ»×ã10%£¬Ø½´ýÌáÉý£¬¹úÄÚAI»¹Óкܴó¿Õ¼äÐ¾Æ¬ÖÆÔìÉÌ¡£ 1.2.ÃÀ¹ú½ûÁî³ÖÐøÉý¼¶£¬¹ú²úËãÁ¦Öû»¼ÓËÙÃÀ¹úAI½ûÁîÔÙ´ÎÉý¼¶£¬GPU³É¿ØÖÆÖص㣬µ¹±Æ¹ú²ú»¯¼ÓËÙ¡£ 2023Äê10ÔÂ17ÈÕ£¬ÃÀ¹úÉÌÎñ²¿¹¤ÒµÓ밲ȫ¾Ö£¨BIS£©Ðû²¼¶ÔÖйúµÈ¹ú¼ÒµÄоƬºÍÈ˹¤ÖÇÄÜ·¢Õ¹½øÒ»²½ÏÞÖÆ£¬Ö÷Òª°üÀ¨¸ßÐÔÄÜËãÁ¦Ð¾Æ¬µÄ³ö¿ÚÏÞÖÆ¡£ÔÚ£¬À©´ó°ëµ¼ÌåÖÆÔì¹ÜÀí£¬²¢½«¸ü¶àÖйúGPUÆóÒµÌí¼Óµ½ÊµÌåÃûµ¥ÖС£

¾ßÌåϸ½ÚÈçÏ¡£ 1£©Ð¾Æ¬³ö¿Ú£ºÓÃÈý¸ö±ê×¼À´¶¨ÒåÄÄЩоƬ±»½ûÖ¹ÏòÖйú³ö¿Ú£¬°üÀ¨×ÜËãÁ¦£¨TPP£©¡¢Ð¾Æ¬ÐÔÄÜÃܶȣ¨PD£©ÒÔ¼°Ð¾Æ¬ÊÇ·ñÊÇÉè¼Æ»òÏúÊ۵ġ£ÓÃÓÚÊý¾ÝÖÐÐÄ¡£¸Ã½ûÁî½ûÖ¹ÏòÖйú³ö¿ÚA800ºÍH800µÈǰÖйúÌØ±ð°æGPU£¬Í¬Ê±Ò²Ó°Ïìµ½Ïû·Ñ¼¶GPU RTX 4090¡£ 2£©ÖÆÔì¿ØÖÆ£ºÀ©´ó¶ÔDUV¹â¿ÌÉ豸µÈ°ëµ¼ÌåÖÆÔìÉ豸µÄ¿ØÖÆ£¬²¢À©´óоƬÉè¼ÆÎļþµÄ´ú¹¤³§Éó²éµÄµØÓòÏÞÖÆ¡£ 3£©ÊµÌåÇåµ¥£ºÐÂÔö13¼ÒÖйúÆóÒµ£¬Ö÷ÒªÊDZØÈ˿Ƽ¼¡¢Ä¦¶ûÏ̵߳ÈGPUÆóÒµ£¬ÕâЩÆóÒµÐèÒª»ñµÃBISµÄÐí¿É²ÅÄÜÖÆÔìоƬ¡£¶àÄêÀ´£¬ÃÀ¹ú²»¶Ï³ǫ̈Ïà¹Ø·¨¹æºÍ½ûÁîÏÞÖÆÖйú´ó½°ëµ¼Ìå·¢Õ¹£¬°üÀ¨Õë¶ÔÐÔ´ò»÷¡¢¹úÄÚ²¹Ìù¡¢³ö¿Ú¹ÜÖÆµÈ´ëÊ©£¬´Ëǰ8ÔÂÔø°ä²¼¹ý¡°Çãµ¹½ûÁ¡£ºÍH800µ±Ê±¶¼ÔÚʹÓ᣽ûÁîºó·¢²¼µÄÖйúרÓÃGPU °æ±¾½µµÍÁ˼ÆËãÄÜÁ¦ºÍ»¥ÁªÍø´ø¿í£¬ÏÖÔÚÒ²Êܵ½ÏÞÖÆ¡£Ó¢Î°´ïÕë¶ÔÖйúÊг¡µÄרÓðæÐ¾Æ¬ÐÔÄܽøÒ»²½¶ñ»¯£¬×è°­Á˹úÄÚÈ˹¤ÖÇÄܵķ¢Õ¹¡£Õë¶ÔÃÀ¹úÐÂÒ»²¨µÄ½ûÖ¹ÐÔ·¨¹æ£¬NVIDIAÖ¼ÔÚ¿ª·¢·ûºÏÃÀ¹úÕþ¸®Õþ²ßÇÒ²»ÐèÒªÐí¿ÉµÄÐÂÐÍÊý¾ÝÖÐÐIJúÆ·£¬²¢¼Æ»®ÍƳöH20¡¢L20µÈÐͺš£¾ÝÌÚѶ¿Æ¼¼Ñ¶£¬¸ù¾ÝĿǰ¹«²¼µÄH20²ÎÊý¹æ¸ñ£¬µ¥¿¨ËãÁ¦Îª0.148P£¨FP16£©£¬Ô¼ÎªA100µÄ50%/H100µÄ15%£¬ÒÔ¼°6+1 HBM3e¡¢96GÈÝÁ¿£¬ NVLink Ôö¼Óµ½900G/s¡£ÓÉÓÚµ¥¿¨ËãÁ¦´ó·ù½µµÍ£¬¹úÄÚAI³§ÉÌÏà±ÈA/H800ÐèÒª²É¹º¸ü¶àµÄH20²ÅÄÜÂú×ãÄ£ÐÍѵÁ·ÐèÇó¡£ÁíÍ⣬H20µ¥¿¨ËãÁ¦½ÏµÍ£¬¿ÉÄÜÎÞ·¨Âú×ãǧÒÚ²ÎÊý¼¶LLMÄ£ÐÍѵÁ·µÄÒªÇ󣬵«¸üÊʺϴ¹Ö±Ä£ÐÍѵÁ·ºÍÍÆÀí¡£ÓÉÓÚµ¥¿¨ÐÔÄܲ»×ãÒÔ¼°×ʽðͶÈë¼Ó´ó£¬¹úÄÚAIÏÂÓγ§É̽«±»ÆÈ¼ÓËÙ¹ú²úÌæ´ú¡£ÊܽûÁîÓ°Ï죬Ӣΰ´ï2023ÄêµÚËļ¾¶ÈÔÚÖйú´ó½µÄÓªÊÕ½ÏÉϼ¾¶È´ó·ùϽµ¡£Êܳö¿ÚÏÞÖÆÓ°Ï죬NVIDIAÔÚÖйúÊг¡µÄÓªÊÕÖð½¥Î®Ëõ£¬¶ø2023ÄêµÚÈý¼¾¶È£¬NVIDIAÔÚÖйú´ó½µÄÓªÊÕ½«´ïµ½40.3ÒÚÃÀÔª£¬»·±ÈÔö³¤47%¡£ÊÕÈë½öΪ19.5 ÒÚÃÀÔª£¬±ÈÉÏÒ»¼¾¶ÈϽµ52%¡£µÚËļ¾¶È£¬Öйú´ó½ռӢΰ´ï×ÜÓªÊÕµÄ8.8%£¬´´Àúʷеͣ¬¹Ù·½Ô¤¼ÆÏÂÒ»¼¾¶ÈÕâÒ»·Ý¶î½«±£³ÖÔÚÕâÒ»·¶Î§ÄÚ¡£

¹ú²úAIоƬ½üÄêÀ´È¡µÃ³¤×ã½ø²½£¬ÃÀ¹úоƬ½ûÁîºÍ¹úÄÚ·¢Õ¹¸ü´óÐͺŵÄÐèÇóΪ¹ú²úÌæ´úÌṩÁËÐµĶ¯Á¦¡£Ä¿Ç°£¬¹úÄÚÖ÷ÒªAIоƬ³§Ḛ́üÀ¨»ªÎªº£Ë¼¡¢º®Îä¼Í¡¢º£¹âÐÅÏ¢¡¢±ØÈʿƼ¼¡¢ËÙÔ´¿Æ¼¼¡¢Ä½Ï£¼¯³Éµç·¡¢Ä¦¶ûÏ̡߳¢ÌìÊàÖÇÄÜоƬµÈ¡£Ò»Ð©¹ú²úÆì½¢ÒѾ­ÔÚËãÁ¦·½ÃæÕ¹¿ª¾ºÕù¡£ NVIDIA A100µÈÊÀ½çÁìÏȲúÆ·ÔÚÄÚ´æºÍ»¥Á¬·½ÃæÒ²½Ó½ü¹ú¼ÊÏȽøË®Æ½¡£¾Ý·͸É籨µÀ£¬NVIDIA H20µÄFP32ÐÔÄÜÔÚijЩ¹Ø¼üÁìÓò²»È绪ΪAscend 910B²úÆ·£¬µ«ÔÚ»¥Á¬ËÙ¶È·½ÃæÓÅÓÚ910B¡£¹úÄÚоƬ³§ÉÌÆ¾½èÓÅÒìµÄ²úÆ·ÐÔÄÜ£¬Öð½¥»ñµÃÏÂÓοͻ§µÄÈϿɡ£¾ÝÖйú»ù½ð±¨±¨µÀ£¬°Ù¶ÈÒѶ©¹º1600̨Ascend 910B£¬ÓÃÓÚ200̨·þÎñÆ÷¡£½ØÖÁ10ÔÂ23ÈÕ£¬»ªÎªÒÑÏò°Ù¶È½»¸¶Á˳¬¹ý60%µÄ¶©µ¥£¬¶ø¿Æ´óѶ·ÉÔÚ2023ÄêQ3²Æ±¨µç»°»áÒéÉϱíʾ£¬¸Ã¹«Ë¾ÔÚ2023Äê³õÓ뻪ΪAscend´ï³ÉÁËÌØ±ðЭÒé¡£Ëû±íʾ£¬ÒѾ­¿ªÊ¼Ñо¿£¬²¢ÒѽӽüÍê³É´ïµ½ÁË»ªÎª·¢²¼µÄAscend 910BµÄÐÔÄÜ¡£Äú¿ÉÒÔÕë¶ÔNVIDIA A100 ÔËÐлù×¼²âÊÔ¡£³ýÁË»ªÎªÉýÌÚÖ®Í⣬º®Îä¼ÍÔª590¡¢º£¹âÉñËãÈýºÅµÈ²úÆ·Ò²ÔÚ»ý¼«Íƹ㡣ÔÚÃÀ¹ú¶Ô»ªÖƲõÄѹÁ¦Ï£¬ÎÒÃÇÈÏΪH20ÊǺìÏßÒÔÄÚ¹ú²úÄÜÂòµ½µÄ×î¸ßµÈ¼¶Ð¾Æ¬£¬¶øÇÒËæ×Źú²úоƬµÄ²»¶Ïµü´ú£¬Äܹ»³¬Ô½ÆäÐÔÄÜЧ¹û£¬Èùú²úµçÄÔÖµµÃÆÚ´ýÄÜÁ¦»ù´¡ÉèÊ©½«»áµÃµ½¸ÄÉÆ¡£

Llama-2×ܹ²Ê¹ÓÃÁË32²ã½âÂëÆ÷£¬²¢ÔÚԭʼLlama-1µÄ»ù´¡ÉϽøÒ»²½´´Ð¡£ 1£©¼Ì³ÐLlama-1µÄѵÁ·Îȶ¨ÐÔÓÅÊÆ£ºÔÚdecoder²ã£¬½«transformerµÄ²ã·¶ÊýÌæ»»Îª£º RMS ·¶Êý¿ÉÌá¸ßѵÁ·Îȶ¨ÐÔ¡£¸ù¾ÝÂÛÎÄ¡¶ËãÁ¦»ù´¡ÉèÊ©¸ßÖÊÁ¿·¢Õ¹Ðж¯¼Æ»®¡·£¬RMS Norm ¿ÉÒÔ¼õÉÙ¼ÆËãʱ¼ä7% µ½64%£»2£©ÀûÓÃLlama-1 µÄ¼ÆËãËÙ¶È£ºÎ»Öñ»RoPE È¡´ú£¨Ïà¶ÔλÖñàÂëºÍ¾ø¶ÔλÖñàÂë½áºÏÁËλÖñàÂëµÄÓŵ㣩 £¬¼È¿ìÓֿ죩£¬Ò×ÓÚÀ©Õ¹³¤¶È£¬¶Ôѧ**token¹ØÏµÓÐÒâÒ壩ҵ½çÁìÏȵıÕÔ´Ìá¸ß¼ÆËãËÙ¶ÈÏà±È½Ï´óµÄÄ£ÐÍ£¬Llama-2 70BÔÚ֪ʶºÍ½â¾öÎÊÌâ·½ÃæµÄ±íÏÖ¸üºÃ¡£¼¼ÄܺÍÊýѧÄÜÁ¦½Ó½üGPT-3.5¡£ MetaÔÚÆÀ¹ÀÖб£³ÖÁË×ã¹»µÄ¿Í¹ÛÐÔ£¬GPT-3.5/GPT-4´ÓOpenAI»ñµÃ½á¹û£¬PaLM/PaLM-2-L´ÓѧÊõÂÛÎÄ»ñµÃ½á¹û£¬×ÜÌåÓÅÓÚLlama-2£¬ÆÀ¹À½á¹ûÓÅÓÚPaLM ¡£ MMLU£¨¶àÈÎÎñÓïÑÔÀí½â¡¢ÖªÊ¶ºÍ½â¾öÎÊÌâÄÜÁ¦µÄÆÀ¹À£©ºÍGSM8K£¨ÊýѧÄÜÁ¦µÄÆÀ¹À£©ÓëGPT-3.5µÄ±íÏÖ½Ó½ü£¬µ«ÓëGPT-4/PaLMÈÔÈ»´æÔڽϴó²îÒì¡£ -2-L¡£ Llama-2Ìṩ7B/13B/30BÈý¸ö°æ±¾£¬Ãâ·ÑÉÌÓ㬿ÉÒÔÏÂÔØÊ¹Óá£Õýʽ¹æ¶¨ÁËÓëLlama-2 Ðí¿ÉÖ¤ºÍÄ£ÐÍ¿¨Ïà¹ØµÄÉÌÒµÏÞÖÆ¡£ 1£©Ðí¿É½ûÁîÃ÷È·½ûֹʹÓÃLlamaÊä³öºÍ½á¹ûÀ´ÔöÇ¿ºÍ¸Ä½øÆäËû´óÐÍÄ£ÐÍ£¬Llama-2¼°ÑÜÉú²úÆ·³ýÍ⣻2£©Ðí¿É½ûÁ¸½¼ÓÉÌÒµÌõ¿îÒªÇóÉÌҵƽ̨ӵÓг¬¹ý7ÒÚÿÔ¶¼»á½øÐÐMeta Ðí¿É»î¶¯£¬µ«Ö»ÒªËûÃÇÕâÑù×ö£¬¾Í¿ÉÒÔÕý³£Ê¹ÓÃLlama-2¡£3£©ÔÚÄ£ÐÍ¿¨Ê¹ÓÃÏÞÖÆÖУ¬ÎÒÃÇÌá³ö²»ÊÊÓÃÓÚÓ¢ÓïÒÔÍâµÄÓïÑÔ£¬ÕâÔÚLlama-2µÄÉÌÒµÏÞÖÆÖÐÊÇÓÐÕùÒéµÄ¡£Ö÷ÒªÔ­Òò¿ÉÄÜÊÇLlama-2ÓïÁÏ¿â´ó²¿·ÖÊÇÓ¢ÎÄ£¬ËµÃ÷Õâ¸öÄ£Ð͵ľÖÏÞÐÔ£¬¶øÁíÒ»·½Ãæ¹úÄÚ³§ÉÌÕýÔÚͨ¹ý¶þ´ÎѵÁ·¿ª·¢Llama-2ÑÜÉúÆ·£¬Äã¿ÉÒÔѵÁ·ÄãµÄÄ£ÐÍ¡£¹úÄÚ´ó¹æÄ£¿ªÔ´Ä£ÐÍÐÔÄÜÁ¼ºÃ£¬Ö§³ÖÃâ·ÑÉÌÓ㬽µµÍÁËAI·¢Õ¹Ãż÷¡£ Scholarè±ÓîInternLM ÊÇÉϺ£È˹¤ÖÇÄÜÑо¿ÔºÓëÉÌÌÀ¿Æ¼¼ÁªºÏ¶àËù¸ßУÁªºÏ·¢²¼µÄ´óÐÍÄ£ÐÍ£¬×îз¢²¼µÄInternLM2 ÓµÓÐ2.6 ÍòÒÚ´ú±ÒÓÃÓÚѵÁ·£¬°üÀ¨7B ºÍ20B ²ÎÊý¹æ¸ñ£¬²¢Ãâ·ÑÌṩÉÌÒµÐí¿ÉÖ¤¡£ÍêÈ«¿ªÔ´µÄ´óÐÍÄ£ÐÍ¡£ÔÚÇáÁ¿¼¶ºÍÖÐÁ¿¼¶¿ªÔ´Ä£ÐÍÖУ¬InternLM2ÔÚ¿¼ÊÔ¡¢ÓïÑÔ¡¢ÖªÊ¶¡¢ÍÆÀí¡¢Êýѧ¡¢´úÂëÁù¸ö·½Ãæ±íÏÖÓÅÔ½¡£ InternLM2µÄ²ÎÊýÁ¿±íÖ»ÓÐ20B£¬ÊôÓÚAGIEval£¨º¬Öйú´óѧÕÐÉú£©¡£ GSM8K£¨ÊýѧÄÜÁ¦ÆÀ¹À£©¡¢MATH£¨ÊýѧÄÜÁ¦ÆÀ¹À£©ÁìÓòÈ¡µÃÁËGPT-3.5µÄ°ÔÖ÷µØÎ»£¬MMLU£¨¶àÈÎÎñÓïÑÔÀí½â¡¢ÖªÊ¶ÆÀ¹ÀºÍÎÊÌâ½â¾ö£¨ÎÊÌâ¼¼ÄÜ£©¡¢BBH£¨ÍÆÀíÊý¾Ý¼¯£© £©¡¢HumanEval£¨OPENAI´´½¨µÄ´úÂëÉú³ÉÄÜÁ¦ÆÀ¹ÀÊý¾Ý¼¯£©ÒѾ­´ïµ½Á˽ӽüGPT-3.5µÄˮƽ¡£Ä¿Ç°ÎÒÃǼÌÐøÎªInternLM2µÄÉÌҵʹÓÃÌṩÃâ·ÑÖ§³Ö£¬µ«Ô¤¼ÆÎ´À´»á½øÒ»²½Ï½µ£¬ÒòΪ¶ÔÓںܶàÖÐСÆóÒµÀ´Ëµ£¬ÕâÊÇÈ˹¤ÖÇÄÜ·¢Õ¹µÄÕ**­¡£¿ªÔ´¡¢´ó¹æÄ£Ä£ÐÍÔ¤¼Æ½«¼ÓËÙÍÆÀí¿¨ÐèÇóµÄÔö³¤¡£¹ú²ú´ó¹æÄ£È˹¤ÖÇÄÜÄ£ÐÍÐèҪǿ´ó¼ÆËãÓ²¼þµÄÖ§³Ö¡£Ô¤ÑµÁ·ÊÇ´óÐÍÄ£ÐÍËãÁ¦ÏûºÄµÄÖ÷Òª½×¶Î¡£¾Þ´óµÄ×ʽðͶÈë´ó´óÌá¸ßÁË×ÔѧÃż÷¡£´ËÍ⣬×ÔÃÀ¹ú³ö¿Ú¹ÜÖÆ¹æ¶¨ÒÔÀ´£¬¹úÄÚ³§É̱»½ûÖ¹²É¹ºNVIDIA¸ß¶ËѵÁ·¿¨£¬¹úÄÚоƬ³§ÉÌÔÚAIѵÁ··½ÃæÓ뺣ÍâÏà±ÈÈÔ´æÔڽϴó²î¾à¡£ÎÒÃÇÏàÐÅ£¬¿ªÔ´´ó¹æÄ£Ä£Ð͵ÄÓÅÔ½ÐÔÄܽ«°ïÖúÏÂÓÎÆóÒµ¿ìËÙѧ**£¬½µµÍ½øÈëAIµÄÃż÷£¬´Ù½øÖÐСÆóÒµÔÚAIÁìÓòµÄ·¢Õ¹£¬¼ÓËÙÈ˹¤ÖÇÄÜÁìÓòµÄ³É³¤¡£ÍÆÀíÐèÇó.¿¨Æ¬¡£

2.2. Sora µÈÄ£ÐͼÓËÙÓ¦Óö˳ÉÊìSora ÊÇÒ»ÖÖ»ùÓÚÀ©É¢µÄTransformer Ä£ÐÍ¡£Æ¾½èÇ¿´óµÄͨÓÃÊÓ¾õÊý¾Ý´¦Àí¹¦ÄÜ£¬Sora ¿ÉÒÔÉú³É¸÷ÖÖ³¤¶È¡¢³¤¿í±ÈºÍ·Ö±æÂʵÄͼÏñÊÓÆµ£¬×¿É´ï60 Ã루1 ·ÖÖÓ£©µÄÁ¬Ðø¸ßÇåÊÓÆµ¡£ Sora ÊÇOpenAI »ùÓÚGPT-4 ºÍDALL-E µÈÓïÑÔºÍͼÏñÄ£Ð͵ĽøÒ»²½Í»ÆÆ£¬´Ó¾²Ì¬µÄ¡¢ÀàËÆÔëÉùµÄÊÓÆµ¿ªÊ¼£¬Öð½¥¶ÔÊÓÆµ½øÐÐÈ¥Ôë´¦Àí¡£´ËÍ⣬¸ÃÄ£ÐÍÄܹ»Éú³É¾ßÓжà¸ö½ÇÉ«¡¢Ìض¨ÀàÐ͵ÄÔ˶¯ÒÔ¼°Ö÷ÌâºÍ±³¾°µÄ¾«È·Ï¸½ÚµÄ¸´ÔÓ³¡¾°£¬ÔÚµ¥¸öÉú³ÉµÄÊÓÆµÖд´½¨¶à¸ö¾µÍ·¡£ÕâÓÐÖúÓÚÈ·±£ÄúµÄ½ÇÉ«ºÍÊÓ¾õ·ç¸ñ׼ȷÇÒÒ»Ö¡£»ùÓÚDALLE 3ºÍGPTÔöÇ¿ÄúµÄÓïÑÔÀí½â¡£ Sora ²ÉÓÃÁ½ÖÖ·½·¨À´ÔöÇ¿ÆäÄ£Ð͵ÄÓïÑÔÀí½âÄÜÁ¦¡£ 1£©»ùÓÚDALLE 3ѵÁ·×ÖĻģÐÍ£¨ÎªÌض¨Í¼Ïñ/ÊÓÆµÉú³É×ÖÄ»£©£¬È»ºóʹÓøÃ×ÖĻģÐÍΪËùÓÐÊÓÆµÉú³É×ÖÄ»¡£ÑµÁ·¼¯£»2£©»ùÓÚGPT½«Óû§Ìáʾת»»Îª¸üÏêϸµÄÃèÊöÐÔ×ÖÄ»²¢·¢Ë͸øSora¡£»ùÓÚÉÏÊöÁ½ÖÖ·½·¨¹¹½¨µÄ´ó¹æÄ£ÊÓÆµÉú³ÉÈ˹¤ÖÇÄÜÄ£ÐÍ¿ÉÒÔÏÔ×ÅÌá¸ßÓ¦ÓóÌÐòµÄÎı¾±£Õæ¶ÈºÍÕûÌåÊÓÆµÖÊÁ¿¡£ Sora Êǽ¨Á¢ÔÚDiT£¨À©É¢±äѹÆ÷£©Ä£ÐÍÖ®Éϵġ£ DiTÄ£ÐÍÊÇÓëTransformerÏà½áºÏµÄÀ©É¢Ä£ÐÍ¡£ DiT=[±äÁ¿×Ô¶¯±àÂëÆ÷£¨VAE£©±àÂëÆ÷+ÊÓ¾õ±ä»»Æ÷£¨ViT£©+È¥ÔëÀ©É¢¸ÅÂÊÄ£ÐÍ£¨DDPM£©+VAE½âÂëÆ÷]¡£¸ù¾ÝWilliam Peebles ºÍSaining Xie ÂÛÎĵÄʵÑé½áÂÛ£¬µ±ÑØ×ÅÄ£ÐÍ´óСºÍÊäÈëtoken ÊýÁ¿Á½¸öÖáÅäÖÃDiT ʱ£¬Gflop ×î¸ßµÄÄ£ÐÍÊÇDiT-XL/2.Masu¡£Ê¹ÓÃ×î´óµÄXL ÅäÖúÍ2 µÄ²¹¶¡´óС¡£Èç¹ûѵÁ·Ê±¼ä×ã¹»³¤£¬DiT-XL/2ÊÇ×îºÃµÄÄ£ÐÍ¡£Ëæ×ÅÏÔ´æ´ø¿íÐèÇóµÄÔö¼Ó£¬ÍÆÀí¼ÆËãÄÜÁ¦Ô¤¼Æ½«Öð½¥ÔöÇ¿¡£ Sora²ÉÓøĽøµÄDiT¼Ü¹¹£¬ÆäËãÁ¦ÏûºÄÓëDiTÀàËÆ¡£ DiT ×ñÑ­ÊÓ¾õ±ä»»Æ÷(ViT) Éè¼ÆÔ­Ôò£¬¿ÉÒÔÌṩ±È´«Í³¾í»ýÍøÂ磨ÀýÈçResNet£©¸ü´óµÄÁé»îÐÔ¡£¸ù¾ÝDiT ¼Ü¹¹ÂÛÎĵÄÔ­×÷ÕßÅжϣ¬Sora ÖеIJÎÊýÊýÁ¿Ô¼Îª30 ÒÚ£¨ÊÇDiT-XL Ä£ÐÍ´óСµÄ3 ±¶£©£¬Õâ½øÒ»²½ÓÐÀûÓÚSora ºóÐøµÄÁé»îµü´ú¡£ÔÚÍÆÀí·½Ãæ£¬Sora »ùÓÚͼÏñÉú³É³¤ÊÓÆµ£¬²¢ÔÚÉú³ÉµÄÊÓÆµÉϽøÐÐÀ©Õ¹£¬Òò´ËÓëʹÓÃÎı¾»òͼÏñÄ£ÐͽøÐÐÍÆÀíÏà±È£¬ËùÐèµÄtoken ÊýÁ¿Ôö¼ÓÁËÒ»¸öÊýÁ¿¼¶¡£¶ÔÍÆÀí¼ÆËãÄÜÁ¦µÄÐèÇ󽫼ÌÐøÔö³¤¡£´ËÍâ£¬Ëæ×Å´ú±ÒÊýÁ¿µÄ²»¶ÏÔö¼ÓÒÔ¼°ÍÆÀí¶Ë¶ÔËãÁ¦µÄÐèÇ󣬶ÔÏÔ´æºÍ´ø¿íµÄÒªÇóÒ²Ô½À´Ô½¸ß£¬400G¹âͨÐż¼ÊõÔÚÒÔÌ«ÍøÖеÄÓ¦ÓÃÔ¤¼Æ½«Ôö¼Ó£¬´ïµ½800GÉõÖÁ1.6 T.Ó¦ÓùâͨÐż¼Êõ¡£ Sora Ô¤¼Æ½«ÔÚ¶à¸öÐÐÒµÇáËÉÉÌÒµ»¯¡£ 360Ê×ϯִÐйÙÖܺèµt±íʾ£¬Sora½«AGIµÄʵʩ´Ó10ÄêËõ¶Ìµ½ÁË1Äê¡£×ÜÌå¶øÑÔ£¬»ùÓÚSoraĿǰµÄÄÜÁ¦£¬¸¨ÒÔÖ§³ÖµÄ1·ÖÖÓÊÓÆµÉú³ÉÒÔ¼°×î¸ß·Ö±æÂÊ2048*2048£¬¿É¹ã·ºÓ¦ÓÃÓÚ¹ã¸æ¡¢ÓÎÏ·¡¢µçÓ°Ô¤¸æÆ¬µÈÁìÓò¡£ÏÖÓвúÆ·£º 1) ÐÂÎÅÒµ£ºSora ÓÐDZÁ¦³¹µ×¸Ä±äÐÂÎű¨µÀ·½Ê½¡£µ±Í»·¢ÐÂÎÅ·¢Éúʱ£¬¼ÇÕßÖ»Ðè±àд¼ò¶ÌµÄ±êÌ⣬ȻºóʹÓÃSoraÄ£Ðͼ´¿ÉÁ¢¼´Éú³ÉÏàÓ¦µÄʵʱÊÓÆµ¡£

ÕâÖÖ´´Ð·½·¨´ó´óÌá¸ßÁËÐÂÎÅÖÆ×÷ºÍ·¢²¼µÄЧÂÊ£¬Ê¹ÐÂÎű¨µÀ¸ü¿ì¡¢¸ü¼°Ê±£»2£©¹ã¸æÐÐÒµ£ºÆóҵʹÓÃSoraÀ´¸Ä½ø²úÆ·¹¦ÄÜ£¬²¢¸ù¾ÝÄúµÄÆ·ÅÆ¹ÊÊ£¬¿ÉÒÔÔں̵ܶÄʱ¼äÄÚ¿ìËÙÉú³É¶à¸ö°æ±¾ÆÚÏÞ´ÙÏú¡£ÊÓÆµ¡£ÕâÖÖ´´Ð·½Ê½²»½öÌá¸ßÁËÓªÏúЧÂÊ£¬»¹´ó·ù½µµÍÁËÖÆ×÷³É±¾£»3£©XR£ºAIÊÓÆµÉú³ÉSora×÷Ϊ´óÐÍÄ£ÐÍ£¬¿ÉÒÔÉú³É±ÆÕæµÄ3DÄ£ÐͺͶ¯»­£¬ÎªÓû§Ìṩ·á¸»¡¢ÓÅÖʵÄXRÓ¦ÓÃÄÚÈÝ×ÊÔ´Âú×ãÄúµÄÐèÇó¡£ÐéÄâÊÀ½çµÄ¸ß±ê×¼¡£´ËÍ⣬SoraÖ§³ÖʵʱäÖȾ£¬ÔÊÐíÓû§ÓëÐéÄâ»·¾³ÊµÊ±½»»¥£¬Ôö¼Ó³Á½þ¸Ð£¬Ìá¸ßÓû§²ÎÓë¶È£¬ÎªXRÓ¦ÓôøÀ´¸ü×ÔÈ»µÄ½»»¥ÌåÑé¡£ÎÒÃÇÈÏΪSoraµ±Ç°½×¶Î¶ÔÓ¦µÄÊÇGPT-3½×¶Î£¬ÕâÊÇÒ»¸ö²»ÍêÕûµÄÄ£ÐÍ£¬µ«»ùÓÚGPT-3µ½GPT-4µÄ¿çÔ½£¬SoraµÄ¹¦Äܽ«¼ÌÐø½øÒ»²½ÍêÉÆ£¬Ëæ×ŽøÒ»²½µÄµü´ú¸¨ÖúGPTºÍDALL¡¤EϵÁУ¬SoraÓÐÍûÔÚB¶Ë¿ìËÙÉÌÓ㬴ø¶¯ÍÆÀí¶ËÐèÇóÔö³¤¡£ 2.3. ASIC¼Ü¹¹ÔÚÍÆÀí¶Ë¿ÉÄÜÓÐÓÅÊÆ¹úÄÚ³§ÉÌÕýÔÚ×·¸Ï¸ü¿ìµÄASIC¼Ü¹¹£¬ÔÚÍÆÀí¶Ë¿ÉÄÜÓÐÓÅÊÆASIC£¨×¨Óü¯³Éµç·£©ÊÇΪÂú×ãÌØ¶¨ÓÃ;¶øÉè¼ÆµÄ£¬¶¨ÖƵļ¯³Éµç·£¬Ö»ÓйؼüµÄµØ·½ÓëÌØ¶¨ÓÃ;ÃÜÇÐÏà¹ØµÄµ¥Ôª±£ÁôÔڼܹ¹ÖУ¬²¢ÇÒ¸ü´ó±ÈÀýµÄоƬ¿Õ¼äÓÃÓÚÖ§³ÖÌØ¶¨ÓÃ;¼ÆËã¡£ÓëGPGPUÏà±È£¬ASIC¾ßÓиßÐÔÄÜ¡¢µÍ¹¦ºÄ¡¢Ð¡Ìå»ýµÈÌØµã£¬¶ÔÓڹ̶¨ÓÃÍ¾ÍÆÀí¶ËµÄÐèÇó¾ßÓÐÃ÷ÏÔµÄÓÅÊÆ¡£ÓëGPU Ïà±È£¬ASIC ¹¦ºÄ¸üµÍ¡£ ASIC Õë¶ÔÓÃ;½øÐÐÁËÓÅ»¯£¬¾ßÓÐʱÖÓÃſء¢¶¯Ì¬µçѹºÍ¶¯Ì¬ÆµÂʵÈÉè¼Æ£¬ÓëGPGPU µÈ¸üͨÓõļܹ¹Ïà±È£¬¹¦ºÄ¸üµÍ£¬Í¬Ê±ASIC ¼õÉÙÁËÈßÓ൥Ԫ£¬ÏÔ׎µµÍÁ˹¦ºÄ¡£ÎªÁ˼õÉÙÐ¾Æ¬Ãæ»ýºÍÖØÁ¿£¬Meta µÄ¼¼Êõ¸ºÔðÈËOlivia Wu ±íʾ£ºÓÐÖúÓÚ½µµÍоƬ¹¦ºÄºÍ³É±¾¡£ ¡· 1£©Ê±ÖÓÃÅ¿ØÉè¼Æ£º¿ÉÒԹرյç·ÖÐδʹÓò¿·ÖµÄÐźţ¬ÏÔ׎µµÍ¹¦ºÄ£»2£©¶¯Ì¬µçѹÉè¼Æ£ºµ±µç·ûÓÐÒÔ×î´óÈÝÁ¿ÔËÐÐʱ£¬½µµÍµç·µçѹÒÔ½ÚÊ¡¹¦ºÄ£»3£©¶¯Ì¬ÆµÂÊÉè¼Æ£ºÔÚASIC¿ÕÏлòÇáÔØÊ±½µµÍƵÂÊ¿ÉÒÔÏÔ׎µµÍ¹¦ºÄ¡£µ±ASIC ´¦ÓÚÖØ¸ºÔØÊ±£¬Ôö¼ÓƵÂÊ¿ÉÒÔÌá¸ßÐÔÄÜ¡£ ASIC ÔÚʵ֤Ñо¿ÖбíÏÖÁ¼ºÃ¡£ÂÛÎÄ¡¶2023 Öйú°ëµ¼ÌåͶ×ÊÉî¶È·ÖÎöÓëÕ¹Íû¡· ÖеÄÑо¿±íÃ÷£¬ASIC ±ÈGPU ºÍFPGA ¾ßÓиüºÃµÄÐÔÄܺ͸üµÍµÄ¹¦ºÄ¡£ÒÔ×îÁ÷ÐеÄASIC ¼Ü¹¹Ö®Ò»µÄTPU ΪÀý£¬AlphaGo µÄÔçÆÚ°æ±¾ÔËÐÐÔÚCPU ºÍGPU ¼¯ÈºÉÏ£¨2015 Äê10 Ôµķֲ¼Ê½°æ±¾ÓÐ1202 ¸öCPU ºÍ176 ¸öGPU£©£¬ºóÀ´µÄ°æ±¾Ê¹ÓÃÁËTPU¡£È¡µÃÁ˽Ϻõijɼ¨¡£´ó¹æÄ£Ä£ÐͲÎÊý²»¶ÏÊÕÁ²£¬ASICÓ­À´·¢Õ¹»úÓö¡£¾¡¹ÜASICÔÚÀíÂÛÉϺÍʵ¼Ê²âÁ¿Öж¼¾ßÓÐÓÅÒìµÄÐÔÄÜ£¬µ«ÆäͨÓÃÐԵ͡¢Éè¼ÆÖÜÆÚ³¤µÈÌØµãʹÆäÔÚÈ˹¤ÖÇÄÜÔçÆÚ´óÁ¿²ÎÊýµÄ´óÐÍÄ£ÐÍ¿ìËÙµü´úµÄÔçÆÚ½×¶ÎÄÑÒÔÔÚʵ¼ÊÓ¦ÓÃÖÐʵÏÖ¡£°Ù·Ö±È½«»á¸üµÍ¡£Ëæ×Å´ó¹æÄ£Ä£Ð͵ÄÖð²½·¢Õ¹£¬²ÎÊýÁ¿µÄÔö¼ÓÔ¤¼Æ»áÖð½¥ÊÕÁ²£¬±ÈÈçSuper Fusion CTO¶¡Óî¾Í±íʾ£¬´ó¹æÄ£Ä£Ð͵ÄÊÕÁ²ÊDZØÈ»Ç÷ÊÆ£¬ÎÒ¾ÍÊÇ¡£µ±´ó¹æÄ£Ä£ÐÍÊÕÁ²Ê±£¬²ÎÊýÇ÷ÓÚÎȶ¨£¬Ä£Ð͵ÄÐÔÄÜÔÚѵÁ·Êý¾ÝºÍÑéÖ¤Êý¾ÝÉÏÒ²´ïµ½Ïà¶ÔÎȶ¨µÄ״̬£¬Òò´Ë¿ª·¢·¢»Ó¸ßÐÔÄÜ¡¢µÍ¹¦ºÄµÈÓÅÊÆµÄASIC·Ç³£ÖØÒª¡£µçÁ¦ÏûºÄ£¬»úÓö¿ÉÆÚ¡£ÏûºÄ¡£ ASIC ÓÐÍû³ÉÎªÍÆÀí¶ËоƬµÄÖ÷µ¼¼Ü¹¹¡£ÀíÂÛÉÏÀ´Ëµ£¬ASICÊÇÒ»ÖÖ¶¨ÖÆÐ¾Æ¬£¬ÔÚ´¦ÀíÍÆÀí¶ËµÄÌØ¶¨ÐèÇó·½Ãæ¾ßÓжÀÌØµÄÓÅÊÆ¡£

´ÓÓ¦Óó¡¾°À´¿´£¬Ëæ×Ÿü´óµÄÄ£ÐÍÊÕÁ²£¬Ä£Ð͵ü´úËٶȼõÂý£¬Ôö¼ÓÁËASICÓ¦ÓõĿÉÐÐÐÔ¡£Âó¿ÏÎý¹«Ë¾¼ÆËãµÃ³ö£¬ASIC ÊÇÂú×ãÍÆÀí¶ËÐèÇóµÄÐí¶àÁìÓòµÄÊ×ѡоƬ¼Ü¹¹£¬°üÀ¨ÓïÑÔÀí½â¡¢Ã沿ʶ±ð¡¢¶¯Ì¬¶¨¼ÛºÍ×Ô¶¯¼ÝÊ»¡£Ëæ×Å´ó¹æÄ£Ä£Ð͵ijÉÊìÒÔ¼°ÏÂÓÎÍÆÀí¶ËÐèÇóµÄ±¬·¢£¬ASICÊг¡·Ý¶î½«¿ìËÙÔö³¤¡£

2.4¡¢º£Íâ¸÷´ó³§É̼ÓËÙASICоƬ²¼¾Ö¹È¸è£ºTPUÊǹȸè×ÔÑеÄAI¼ÓËÙоƬ£¬ÆäAIÄ£ÐÍgemini²ÉÓÃTPUÖ§³ÅËãÁ¦¡£¹È¸è´Ó2006Äê¾Í¿ªÊ¼¿¼ÂÇASIC²¼¾Ö£¬²¢ÔÚ2016Äê¹È¸èI/O¿ª·¢Õß´ó»áÉÏÕýʽÐû²¼ÄÚ²¿³É¹¦¿ª·¢³öTPU£¬ÎÒÀ´ÁË¡£ TPU v4 ±ÈNvidia A100 ¸üºÃ£¬µ«ÔÚH100 ÉÏÉԲ TPU-v5p оƬ¿ÉÌṩ197TFLOPS (BF16) µÄ·åÖµ¼ÆËãÄÜÁ¦ºÍ820GB/s µÄ´ø¿í£¬ÓëÉÏÒ»´úÏà±È£¬ÑµÁ·ÐÔÄÜÌá¸ß2 ±¶£¬ÍÆÀíÐÔÄÜÌá¸ß2.5 ±¶¡£ TPUϵÁвÉÓÃ128*128 MXUÄ£¿é£¬¸ü¸ßЧµØÔËÐÐоƬ¡£ TPU-v1ÊÇרÓÃÓÚÍÆÀíµÄоƬ£¬TPU-v2ºÍTPU-v3ÊÇÍÆÀíºÍѵÁ·Á½ÓÃоƬ£¬»ùÓÚVolta¼Ü¹¹£¨

GPGPU£©Ïà±È£¬TPU-v3 ÔÚÐÔÄܱíÏÖ½Ó½üµÄÇé¿öÏÂʵÏÖÁ˸ü СµÄÐ¾Æ¬Ãæ»ý¡£ÔÚ MXU Ä£¿é£¬TPU-v2 ºÍ TPU-v3 °Ñ TPU-v1 µÄµ¥¸ö 256*256 MXU ÐÞ¸ÄΪ 4 ¸ö 128*128 MXU ¾í»ýÄ£ÐÍ£¬°ÑÀûÓÃÂÊ´Ó 22%- 30%ÌáÉýÖÁ 37%-48%£¬´øÀ´¸ü¸ßµÄÔËÐÐЧÂÊ£¬Èç¹û½øÒ»²½Ñ¹ËõΪ 16 ¸ö 64*64 Ä£¿é£¬ÀûÓÃÂÊԼΪ 38%-52%£¬ÌáÉý½ÏС£¬µ«ÓÉËùÐè¿ØÖÆÄ£¿é µÈ´øÀ´µÄÃæ»ý»á´ó·ùÔö¼Ó£¬Òò´Ë 128*128 ÊDZȽÏÀíÏëµÄ MXU Ä£¿éÀà ÐÍ¡£ºóÐøµÄ TPU-v4 ¸üÊÇ»ùÓÚ´ËÔÚÃæ»ýδ´ó·ùÌáÉýµÄÇé¿öÏ£¬ÒÔ¸üµÍµÄ ¹¦ºÄ£¨300W£©ÊµÏÖÁ˳¬ TPU-v3 2 ±¶µÄËãÁ¦£¨275TFLOPS£©¡£TPU-v5e ºÍ TPU-v5p ·Ö±ðÊÇ TPU ϵÁÐÖÐ×î¾ß³É±¾Ð§ÒæºÍ×îÇ¿´óµÄ²ú Æ·£¬´¦ÓÚÒµÄÚÁìÏȵØÎ»¡£TPU v5e Pod ƽºâÁËÐÔÄÜ¡¢Áé»îÐÔºÍЧÂÊ£¬ ÔÊÐí¶à´ï 256 ¸öоƬ»¥Á¬£¬Í¨ÓÃÐÔ·½ÃæÖ§³Ö°ËÖÖ²»Í¬ÐéÄâ»úÅäÖã¬¿É ÒÔÓɿͻ§×ÔÐÐÑ¡ÔñÒÔ·þÎñÓÚ¸÷ÖÖÄ£ÐÍ¡£TPU-v5p Ö÷ÒªÌáÉý·½ÏòΪÐÔ ÄÜ£¬Áé»îÐԺ͹æÄ££¬Í¨¹ý×î¸ß´ø¿íµÄоƬ¼ä»¥Áª£¨ICI£©£¬ÒÔ 4800 Gbps/chip ÔÚ 3D Ô²»·ÍØÆËÖн« 8960 ¸öоƬ×éºÏÔÚÒ»Æð¡£¸ù¾Ý¹È¸è¹Ù ·½Êý¾Ý£¬½èÖúµÚ¶þ´ú SparseCore£¬BF16 Ï TPU-v5p µÄѵÁ·Ð§ÂÊ´ï TPU-v4 µÄ 1.9 ±¶£¬Èç²ÉÓà INT8 ½øÐÐѵÁ·ÔòѵÁ·Ð§ÂÊ´ï 2.8 ±¶¡£Ó¢Ìضû£ºGaudi2 ´ó·ùÁìÏÈ A100£¬ÉÔÈõÓÚ H100¡£Ó¢ÌضûÊÇÈ«ÇòÁìÏÈµÄ Ð¾Æ¬ÖÆÔìÉÌ£¬ÓÚ 2020 Äê 1 ÔÂÊÕ¹º habana ÓÃÓÚÉú²ú ASIC оƬ Gaudi ϵÁУ¬Ä¿Ç°ÒÑÍÆ³ö Gaudi¡¢Gaudi2 ºÍÖйú¶¨ÖưæÐ¾Æ¬ Gaudi2C£¬ÆäÖÐ Gaudi2C ³öÓÚ¹æ±Ü½ûÁîµÄÄ¿µÄ¶ÔËãÁ¦½øÐÐÁË´ó·ùϵ÷¡£¸ù¾Ý¹«Ë¾¹ÙÍø µÄÊý¾Ý£¬Ïà±ÈÓÚ A100£¬2022 ÄêÍÆ³öµÄ Gaudi2 Äܹ»ÔÚ BF16/FP32 ¾« ¶ÈÏÂʵÏÖѵÁ·¶Ë 1.70-2.44 ±¶±íÏÖ£¬ÔÚÍÆÀí¶Ë 1.42-2.89 ±¶±íÏÖ£¬¿¼ÂÇ µ½ H100 ÊÇ A100 ÍÆÀí/ѵÁ·±íÏÖµÄ 3.5/2.3 ±¶£¬Ô¤¼Æ Gaudi2 ÕûÌåÐÔÄÜ ÈõÓÚ H100¡£Gaudi2 ÔÚµÚÒ»´ú Gaudi »ù´¡ÉϽøÐÐÁËÉý¼¶£¬ÖúÁ¦¿Í»§½µ±¾ÔöЧ¡£ Gaudi2 ½¨Á¢ÔÚµÚÒ»´ú Gaudi ÉÏ£¬ÖƳ̹¤ÒÕ´Ó 16nm Éý¼¶Îª 7nm£¬Ôö¼Ó ÁË FP8 ¾«¶ÈÖ§³Ö£¬²ÉÓà HBM2e 96GB ÄÚ´æºÍ 2.45TB/s ´ø¿í¡£ÔÚ Gaudi2 Éϼ̳ÐÁË 24 ¸ö RoCE2 ¶Ë¿Ú£¨µÚÒ»´ú Gaudi Ϊ 10 ¸ö£©£¬²ÉÓà °Ë¿¨»¥Áª¼Ü¹¹´î½¨£¬Í¬Ê±ÌṩÏàÓ¦»ù°å¡£Í¨¹ýƬÉÏ RoCE ¼¯³É£¬¿Í»§ ¿ÉÒÔÇáËÉÀ©Õ¹ÅäÖà Gaudi2 ϵͳÒÔÂú×ãÉî¶Èѧ**ÒªÇó£¬Í¬Ê±ÓÉÓÚ¿ÉÒÔͨ ¹ýÒÔÌ«ÍøÊµÏÖ Gaudi Ö®¼äµÄͨÐÅ£¬Äܹ»Îª¿Í»§ÊµÏÖ¶îÍâµÄ³É±¾½ÚÔ¼¡£ÑÇÂíÑ·£º×ÔÑÐ ASIC оƬ£¬Trainium2 ÐÔÄÜÓÐÍûʵÏÖÐÂÍ»ÆÆ¡£ÑÇÂíÑ·×Ô ÑÐ ASIC оƬ°üÀ¨ Inferential ºÍ Trainium Á½¸öϵÁУ¬·Ö±ðÓÃÓÚÍÆÀíºÍ ѵÁ·¡£Ä¿Ç°ÍÆÀíоƬµü´úÖÁ Inferential2£¬·åÖµËãÁ¦´ï 380TOPS £¨INT8£©£¬½ÏÉÏÒ»´úоƬÌáÉý 5 ±¶£»ÑµÁ·Ð¾Æ¬µü´úÖÁ NeuroCore-v2¡£ASIC δÀ´·Ý¶îÓÐÍû¿ìËÙÌáÉý¡£Ïà½ÏÓÚ GPU£¬ASIC ´¦ÀíËٶȸü¿ì£¬µ«¶¨ ÖÆ»¯³Ì¶È¸ß£¬³É±¾½Ï´ó¡£ÔÚ AI ·¢Õ¹³õÆÚ£¬¸÷´ó»¥ÁªÍø¾ÞÍ··×·××ÔÑдóÄ£ ÐÍ£¬ÒòӢΰ´ï GPU+CUDA ͨÓÃÐԽϸߣ¬ÏÂÓδ󶼲ÉÓÃÆä²úÆ·½øÐÐÓ²¼þ ´î½¨¡£´ËÍâ³õÆÚ¸÷¼ÒÄ£ÐͲÎÊý¼°Ëã·¨²»¶ÏÓÅ»¯Éý¼¶£¬ÕûÌåµü´úËٶȿ죬 ²»ÊʺϲÉÓö¨ÖÆ»¯³É±¾½Ï¸ßµÄ ASIC ·½°¸¡£µ«Î´À´°éËæÄ£Ð͵ü´ú·Å»º£¬ ²ÎÊýÁ¿ÊÕÁ²£¬Ëã·¨¸´ÔÓÐÔÒªÇóÌá¸ß£¬ASIC Õë¶ÔÌØ¶¨ÐèÇ󿪷¢µÄ¶¨ÖÆ»¯ÓÅ ÊÆÓÐÍûÏÔÏÖ£¬Ò²ÓÐÀûÓÚÓ븴ÔÓËã·¨ÓиüǿƥÅ䣬·Ý¶îÓÐÍû¿ìËÙÔö³¤¡£¹ú²ú AI оƬ³§ÉÌÓÐÍûÔÚÍÆÀíÁìÓò¼ÓËÙ×·¸Ï¡£Ïà½ÏÓÚѵÁ·Ð¾Æ¬£¬ÍÆÀíоƬ ¶ÔÉú̬¼°¶à¿¨»¥ÁªÒªÇó½ÏС£¬Ä¿Ç°¹ú²ú³§Ḛ́üÀ¨»ªÎª•NÌÚ¡¢º®Îä¼Í¡¢ìÝ Ô­¿Æ¼¼µÈ³§É̲úÆ·¾ù»ùÓÚ ASIC ¼Ü¹¹£¬È«Çò ASIC Êг¡²¢Î´ÐγÉÃ÷ÏÔµÄ Í·²¿³§ÉÌ£¬¹ú²ú¹«Ë¾ºóÐøÓÐÍûÖð²½×·¸Ï¡£ Èý¡¢¹ú²úËãÁ¦£ºAI ʱ´ú³Ë·çÆð3.1¡¢»ªÎª•NÌÚ£º¹ú²úËãÁ¦Áì¾üÕß»ªÎª•NÌÚ£¨HUAWEI Ascend£©ÏµÁÐоƬÊÇ»ùÓÚ»ªÎª×ÔÖ÷Ñз¢µÄ´ï·ÒÆæ ¼Ü¹¹Éè¼ÆµÄ AI оƬ£¬°üÀ¨ÑµÁ·ºÍÍÆÀíоƬ£¬Æä²ÎÊý¼°±íÏÖÔÚ¹úÄÚ´¦ÓÚÁì ÏÈˮƽ£¬²¢ÑÜÉú³ö¶ÀÌØµÄ•NÌÚ¼ÆËã²úÒµ¡£•NÌÚϵÁÐоƬÖ÷ÒªÓÉ»ªÎªÈ«×Ê ×Ó¹«Ë¾ÉîÛÚÊк£Ë¼°ëµ¼ÌåÓÐÏÞ¹«Ë¾Ñз¢£¬¸Ã×Ó¹«Ë¾³ÉÁ¢ÓÚ 2004 Ä꣬³ý •NÌÚÍ⻹ӵÓÐ÷è÷ë¡¢°ÍÁú¡¢öïÅôµÈ×ÔÑÐоƬϵÁУ¬Ñз¢ÊµÁ¦Ç¿´ó¡£¡°ÈíÓ²¼þ+È«Éú̬¡±´òÔìÃæÏò¡°¶Ë¡¢±ß¡¢ÔÆ¡±µÄÈ«³¡¾° AI »ù´¡ÉèÊ©¡£•NÌÚ¼Æ Ëã²úÒµÊÇ»ùÓÚ•NÌÚϵÁд¦ÀíÆ÷ºÍ»ù´¡Èí¼þ¹¹½¨µÄȫջ AI ¼ÆËã»ù´¡ÉèÊ©¡¢ ÐÐÒµÓ¦Óü°·þÎñ£¬°üÀ¨•NÌÚϵÁд¦ÀíÆ÷¡¢ÏµÁÐÓ²¼þ¡¢CANN£¨ComputeArchitecture for Neural Networks£¬Òì¹¹¼ÆËã¼Ü¹¹£©¡¢AI ¼ÆËã¿ò¼Ü¡¢Ó¦Óà ʹÄÜ¡¢¿ª·¢¹¤¾ßÁ´¡¢¹ÜÀíÔËά¹¤¾ß¡¢ÐÐÒµÓ¦Óü°·þÎñµÈÈ«²úÒµÁ´¡£ÆäÖУ¬ ÒÔоƬΪÖ÷µÄȫӲ¼þÌåϵÊÇʵÏÖ AI ÑµÍÆµÄµ×²ãÖ§³Å£¬ÒÔ×ÔÑмÆËã¼Ü¹¹Îª Ö÷µÄÈí¼þÌåϵÊÇÎüÒý¿ª·¢ÕߵĻîÁ¦Ö®Ô´£¬ÒÔÓ¦ÓÃÈí¼þΪÖ÷µÄ²úÒµÉú̬ÊÇ ÃæÏòδÀ´·¢Õ¹µÄ²»½ß¶¯Á¦¡£•NÌÚÓ²¼þÌåϵÊÇʵÏÖ AI ÑµÍÆµÄËãÁ¦»ù´¡ºÍµ×²ãÖ§³Å¡£•NÌÚ¼á³Ö¡°Ó²¼þ¿ª ·Å¡±²ßÂÔ£¬Îª¿Í»§Ìṩ×ÔÓÐÓ²¼þºÍ»ï°éÓ²¼þµÄ¶àÑù»¯ËãÁ¦Ñ¡Ôñ¡£ 1£©×ÔÓÐÓ²¼þΪ•NÌÚϵÁд¦ÀíÆ÷ÒÔ¼°»ùÓÚ•NÌÚ´¦ÀíÆ÷ºÍÒµ½çÖ÷Á÷Òì¹¹¼Æ Ë㲿¼þµÄ•NÌÚ Atlas ϵÁÐÓ²¼þ²úÆ·¡£•NÌÚϵÁд¦ÀíÆ÷Ö÷Òª°üÀ¨•NÌÚ 310¡¢ •NÌÚ 910¡¢•NÌÚ 910B µÈ£¬•NÌÚ Atlas ϵÁÐÓ²¼þ²úÆ·°üÀ¨¸÷ÀàÄ£×é°å¿¨¡¢ Сվ¡¢·þÎñÆ÷¡¢¼¯ÈºµÈ·á¸»µÄ²úÆ·ÐÎ̬¡£•NÌÚ×ÔÓÐÓ²¼þÌåϵּÔÚ´òÔìÃæ Ïò¡°ÔÆ¡¢±ß¡¢¶Ë¡±µÄÈ«³¡¾° AI »ù´¡ÉèÊ©·½°¸£¬¿É¹ã·ºÓÃÓÚ¡°Æ½°²³ÇÊÐÖÇÄܽ» ͨ¡¢ÖÇÄÜÒ½ÁÆ¡¢ÖÇÄÜÁãÊÛ¡¢ÖÇÄܽðÈÚ¡±µÈÁìÓò¡£ 2£©»ï°éÓ²¼þÖ¸»ªÎª¿ª·Å×ÔÓÐÓ²¼þ£¬ºÏ×÷»ï°é¿É½øÐм¯³ÉºÍ¶þ´Î¿ª·¢£¬»ò Õßͨ¹ý OEM/ODM ·½Ê½¿ª·¢×ÔÓÐÆ·ÅƵķþÎñÆ÷Õû»ú¡£•NÌÚϵÁд¦ÀíÆ÷ÊÇÓ²¼þÌåϵµÄºËÐÄ¡£•NÌÚ´¦ÀíÆ÷רΪ AI ¼ÆËãÉè¼Æ£¬ÓµÓÐ ×ÔÑдï·ÒÆæ¼Ü¹¹µÄ£¬Äܹ»¸²¸Ç¶Ë±ßÔÆÈ«³¡¾°£¬Âú×㲻ͬ²¿Êð»·¾³²îÒìÐÔ µÄËãÁ¦ÐèÇó¡£»ªÎªÓÚ 2018 Äê 10 ÔµĻªÎªÈ«Áª½Ó´ó»áÉÏÊ״βûÊöÁË»ªÎª AI Õ½ÂÔ£¬²¢¹«²¼ÁË•NÌÚ 910 ºÍ•NÌÚ 310 Á½¿î AI оƬ£¬ÆäÖЕNÌÚ 310 ÊÇ Ò»¿î×î´ó¹¦ºÄ½ö 8W µÄ¼«Ö¸ßЧ¼ÆËãµÍ¹¦ºÄ AIоƬ£¬2018 ÄêÉÌÓÃÁ¿²ú£¬ ¿ÉÓÃÓÚÍÆÀí¶Ë£»•NÌÚ 910 ÔÚ 2019 Äê 8 ÔÂÕýʽÉÌÓã¬ÓÃÓÚѵÁ·¶Ë¡£•NÌÚ 910 Ê״βÉÓôï·ÒÆæ¼Ü¹¹£¬»ùÓÚ 7nm ÔöÇ¿°æ EUV ¹¤ÒÕ£¬¼¯³É 32 ¸öÁ¢·½ Ì弯ËãÒýÇæ£¬°ë¾«¶È£¨FP16£©ËãÁ¦´ï 320 TFLOPs£¬Ïà±ÈӢΰ´ïµ±Ê±µÄ V100 SXM µÄ 125 TFLOPS ¸ßÒ»±¶ÒÔÉÏ¡£2023 Äê 9 Ô£¬»ªÎªÔÚÊÜÃÀ¹ú ÖÆ²ÃÈýÄêºó·¢²¼•NÌÚ 910B£¬ÆäÐÔÄÜÈ¡µÃÖØ´óÍ»ÆÆ£¬µ¥¾«¶ÈËãÁ¦´ó·ùÌá Éý£¬±íÃ÷»ªÎª³öÉ«µÄоƬ×ÔÑÐÄÜÁ¦Óë•NÌÚ AI ´¦ÀíÆ÷δÀ´¼«¸ßµÄÔö³¤¿Õ ¼ä¡£×ÔÑдï·ÒÆæ¼Ü¹¹´ó·ùÌáÉý AI ËãÁ¦¡£•NÌÚϵÁÐ AI ´¦ÀíÆ÷´´ÐÂʹÓôï·ÒÆæ ¼Ü¹¹£¬ÊÇ»ªÎª×ÔÑеÄÃæÏò AI ¼ÆËãÌØÕ÷µÄȫмÆËã¼Ü¹¹£¬¾ß±¸¸ßËãÁ¦¡¢¸ß ÄÜЧ¡¢Áé»î¿É²Ã¼ôµÄÌØÐÔ¡£»ùÓÚ´ï·ÒÆæ¼Ü¹¹µÄ AI ºËÄÚº¬ 3D Cube¡¢Vector ÏòÁ¿¼ÆËãµ¥Ôª¡¢Scalar ±êÁ¿¼ÆËãµ¥ÔªµÈ£¬¹²Í¬±£ÕÏ AI ¼ÆËãµÄ¸ßЧ´¦Àí¡£ ÔÚÉñ¾­ÍøÂçÄ£ÐÍÖÐ 99%µÄ¼ÆËã¶¼ÐèÒªÓõ½¾ØÕó³Ë·¨ÔËË㣬Õⲿ·ÖÔËËãÊÇ AI ¼ÆËãµÄºËÐÄ£¬ÔÚ´ï·ÒÆæ¼Ü¹¹ÖÐÓÉ 3D Cube À´Íê¡£3D Cube Äܹ»ÔÚÒ» ¸öʱÖÓÖÜÆÚÄÚÍê³É 4096 ´Î³Ë¼ÓÔËË㣬Ïà±È´«Í³ 2D ½á¹¹ÔËËãÖÜÆÚ¶Ì¡¢Ê± Ñӵ͡¢ÀûÓÃÂʸߡ£´ËÍ⣬AI ºËÖÐµÄ Buffer L0A¡¢L0B¡¢L0C ÓÃÓÚÏò 3D Cube ÊäËÍÊý¾ÝºÍ´æ·Å¼ÆËã½á¹û¡£¸ßËÙ»¥Áª·½Ã棺•NÌÚ´¦ÀíÆ÷»¹ÓµÓÐ×ÔÑÐ HCCS ½Ó¿Ú£¬¿ÉÒÔÍê³É•NÌÚ´¦Àí Æ÷Ö®¼äµÄ»¥Áª£¬×îÐÂÒ»´ú•NÌÚ 910B µÄ HCCS »¥ÁªËٶȿɴï 392 GB/s£¬ ½áºÏ PCle 5.0 ºÍ RoCE ½Ó¿Ú¿ÉÒÔ×齨¸ü¾ß¹æÄ£µÄѵÁ·ÏµÍ³£¬È«ÃæÊÍ·Å Ó²¼þËãÁ¦¡£AI ¼¯ÈºÊÇ´óÄ£ÐÍѵÁ·µÄ×îÖÕÓ²¼þ²úÆ·ÐÎ̬£¬•NÌÚ AI ¼¯Èº¿ÉÖ§³ÖÍò¿¨¹æ Ä£¡£»ªÎª»ùÓÚ•NÌÚϵÁд¦ÀíÆ÷¿ª·¢ÓÐһϵÁЕNÌÚ Atlas Ó²¼þ²úÆ·£¬°üÀ¨ Ä£¿é¡¢°å¿¨¡¢ÖÇÄܱßÔµ¡¢·þÎñÆ÷¡¢¼¯ÈºµÈ£¬¿É¹ã·ºÓ¦ÓÃÓÚ½ÌÓý¿ÆÑС¢ÖÇ »Û³ÇÊС¢Öǻ۽»Í¨µÈ¸÷ÖÖËãÁ¦ÐèÇóˮƽµÄÁìÓò¡£ÔÚ´óÄ£ÐÍѵÁ·ÖÐÓÉÓÚµ¥ ¿¨ËãÁ¦ÓÐÏÞ£¬Í¨³£»á»ùÓڶ࿨»¥ÁªÐγÉǧ¿¨ÄËÖÁÍò¿¨¹æÄ£µÄ¼¯Èº£¬»ªÎª Äܹ»Ìṩ»ò×é×°°üÀ¨¼¯ÈºÔÚÄÚµÄȫϵӲ¼þ²úÆ·¡£2023 Äê 7 Ô»ªÎªÐû²¼ •NÌÚ AI ¼¯Èº¹æÄ£´Ó×î³õµÄ 4000 ¿¨¼¯ÈºÀ©Õ¹ÖÁ 16000 ¿¨£¬³ÉΪҵ½çÊ׸ö Íò¿¨ AI ¼¯Èº£¬ÓµÓиü¿ìµÄѵÁ·ËÙ¶ÈºÍ 30 ÌìÒÔÉϵÄÎȶ¨ÑµÁ·ÖÜÆÚ£¬Ê®±¶ ÁìÏÈÒµ½ç¡£ÍƳöÒì¹¹¼ÆËã¼Ü¹¹ CANN£¬¹¹ÖþÉú̬»¤³ÇºÓ¡£CANN£¨Compute Architecture for Neural Networks£©ÊÇ»ªÎªÕë¶Ô AI ³¡¾°ÍƳöµÄÒì¹¹¼ÆË㠼ܹ¹£¬¶ÔÉÏÖ§³Ö PyTorch¡¢MindSpore¡¢TensorFlow µÈ¶àÖÖ AI ¿ò¼Ü£¬¶Ô Ï·þÎñ AI ´¦ÀíÆ÷Óë±à³Ì£¬·¢»Ó³ÐÉÏÆôϵĹؼü×÷Óã¬ÊÇÌáÉý•NÌÚ AI ´¦ ÀíÆ÷¼ÆËãЧÂʵĹؼüƽ̨¡£ CANN ÌáÁ¶³öÈý²ãÂß¼­¼Ü¹¹¡ª¡ªÓ¦Óò㡢оƬʹÄܲ㡢¼ÆËã×ÊÔ´²ã£¬Ó¦ ÓòãÌṩ¸øÓû§¸÷ÖÖËã·¨¿ª·¢¡¢µ÷ÓŹ¤¾ß£¬Ð¾Æ¬Ê¹ÄܲãÌṩÐÔÄÜÌáÉý½â ¾ö·½°¸£¬¼ÆËã×ÊÔ´²ãÌṩÊý¾Ý´¦Àí¼°ÔËËãÖ´ÐÐÉ豸µÈ¡£Èý²ãÂß¼­¼Ü¹¹Õ¹ ÏÖÁËÆä¼«¼ò¿ª·¢¡¢¼«ÖÂÐÔÄÜ¡¢¿ª·ÅÉú̬µÄÌØµã£¬ÕâÐ©ÌØµã¶Ô•NÌÚоƬ¶á È¡ÊÐÕ¼ÂʾßÓÐÕ½ÂÔÐÔÒâÒ壺 1£©¼«¼ò¿ª·¢£ºCANN Õë¶ÔËã×Ó¿ª·¢³¡¾°ÍƳö Ascend C£¬Ô­ÉúÖ§³Ö C ºÍ C++±ê×¼¹æ·¶£¬×î´ó»¯Æ¥ÅäÓû§¿ª·¢**¹ß£»Í¨¹ý¶à²ã½Ó¿Ú³éÏó¡¢×Ô¶¯²¢ÐмÆËã¡¢ÂÏÉúµ÷ÊԵȹؼü¼¼Êõ£¬ÖúÁ¦ AI ¿ª·¢Õß½µ±¾ÔöЧ¡£ 2£©¼«ÖÂÐÔÄÜ£ºÍ¨¹ý×ÊÔ´Áé»îµ÷¶È¡¢Ëã×ÓÉî¶ÈÈںϡ¢¼ÆËã¸ß¶È²¢ÐУ¬¶Ô´ó Ä£ÐÍÐÔÄÜÉî¶ÈÓÅ»¯¡£ 3£©¿ª·ÅÉú̬£ºÈ«Ãæ¼æÈÝÒµ½çÈÚºÏËã×Ó¡¢AI ¿ò¼Ü¡¢¼ÓËÙ¿âºÍÖ÷Á÷´óÄ£ÐÍ¡£CANN ·¢Õ¹Ñ¸ËÙ£¬Í¬ CUDA ¸÷·½Ãæ²î¾à²»¶ÏËõС¡£CANN ºÍ OpenCL ¶¼ÊÇÒì¹¹¼ÆËã¼Ü¹¹£¬ÊôÓÚ¿ª·ÅʽÉú̬£¬¿É¶Ô½ÓÆäËûÀàÐÍ GPU£¬Ïà±ÈÓÚ½ö Ó¦ÓÃÓÚ×ÔÉí GPU µÄ CUDA ºÍ ROCm ÓÐÒ»¶¨ÓÅÊÆ£»ÔÚÔËÐÐÐÔÄÜ·½Ã棬 CANN ¿É½« Attenion ´¦ÀíÐÔÄÜÌáÉý 50£¬ËäÈ»ÕûÌåÐÔÄÜÈÔÈõÓÚ CUDA£¬ µ«ÒÑÓÐÆðÉ«£»ÔÚ¿ª·¢ÕßÊýÁ¿·½Ã棬2021 Äê CANN ÒÑÓµÓг¬ 60 Íò¿ª·¢ Õߣ¬½ØÖÁ 2023 ÄêÄêÄ©£¬•NÌÚ AI ¹²·¢Õ¹Á˳¬ 220 Íò¿ª·¢Õߣ¬·õ»¯ÁË 2600 ¸÷½â¾ö·½°¸£¬Í¬ CUDA µÄ 400 Íò¿ª·¢ÕßÊýÁ¿ºÍ 3000 Ó¦ÓóÌÐòµÄ²î¾àѸ ËÙËõС¡£AI ¿ò¼ÜÖØÏÖ¶à×㶦Á¢Ö®ÊÆ¡£AI ¿ò¼ÜÔµÆðÉñ¾­ÍøÂç·½·¨£¬Éñ¾­ÍøÂç·½·¨ÊÇ ÒÔͳһËã·¨Éè¼ÆÊӽǽâ¾ö¸÷ÀàÓ¦ÓÃÈÎÎñ²¢ÄâºÏº£Á¿Êý¾ÝµÄ·½·¨£¬Ëæ×Å¿ª ·¢Ð§ÂʺÍËãÁ¦µÄÐèÇó²»¶ÏÌá¸ß£¬Äܹ»Ìṩ¿ÉÊÓ»¯½çÃæ²¢×¨×¢ÓÚÓ¦ÓóÌÐò ÒµÎñÂß¼­µÄ AI ¿ò¼ÜÖð½¥µ®Éú¡£×Ô 2000 ÄêÆð£¬AI ¿ò¼Ü¾ºÕù¸ñ¾Ö´Ó×î³õµÄ MATLAB¡¢Numpy¡¢SciPyµ½2015ÄêµÄPyTorch£¨Facebook£©¡¢TensorFlow £¨Google£©Ë«Í·Â¢¶Ï£¬¾­ÀúÁËÒ»´Î´Î¾ºÕù¡ª¡ªÂ¢¶Ï¡ª¡ª¾ºÕùµÄÑ­»·¡£Ëæ ×Å´óÄ£ÐÍʱ´úµÄµ½À´£¬AI ¿ò¼ÜÒÑÐγÉÁËеľºÕù¸ñ¾Ö£¬³ý´«Í³µÄ Pytorch ºÍ TensorFlow Í⣬»ªÎª MindSpore¡¢¿õÊÓÌìÔª MegEngine¡¢°Ù¶È Paddle µÈÒ²Õ¼¾ÝÁËÒ»¶¨Êг¡·Ý¶î£¬Ðγɶà×㶦Á¢Ö®ÊÆ¡£•N˼ MindSpore Ö¼ÔÚʵÏÖÒ׿ª·¢¡¢¸ßЧִÐС¢È«³¡¾°¸²¸ÇÈý´óÄ¿±ê¡£ ÆäÖУ¬Ò׿ª·¢±íÏÖΪ API ÓѺᢵ÷ÊÔÄѶȵͣ»¸ßЧִÐаüÀ¨¼ÆËãЧÂÊ¡¢ Êý¾ÝÔ¤´¦ÀíЧÂʺͷֲ¼Ê½ÑµÁ·Ð§ÂÊ£»È«³¡¾°ÔòÖ¸¿ò¼Üͬʱ֧³ÖÔÆ¡¢±ßÔµ ÒÔ¼°¶Ë²à³¡¾°¡£MindSpore Ò×ÓÃÐÔÍ»³ö£¬Ö§³ÖÓïÑÔ½«¼ÌÐøÀ©³ä¡£Í¬ PyTorch¡¢TensorFlow¡¢ Paddle Ïà±È£¬MindSpore Ò×ÓÃÐÔÓÅÓÚ PyTorch ºÍ TensorFlow£¬Äܹ»½ö ÓÃÒ»ÐдúÂëÇл»¾²Ì¬Í¼ºÍ¶¯Ì¬Í¼»úÖÆ£»¼æÈÝÐÔÓÅÓÚ Paddle£¬ÊÊÓÃÓÚ¶àÖÖ CPU/GPU/TPU¡£¸ù¾Ý¡¶ÖйúÈ˹¤ÖÇÄÜ¿ò¼ÜÊг¡µ÷Ñб¨¸æ¡·£¬¿ª·¢ÕßÑ¡Ôñ AI ¿ò¼Üʱ£¬Ê×ÏÈ¿¼ÂǵÄÈý¸öÒòËØÊÇÒ×ÓÃÐÔ¡¢ÐÔÄÜ¡¢Ö§³ÖµÄÓ²¼þ£¬MindSpore µÄÈý·½Ãæ±íÏÖ¾ù½ÏΪͻ³ö£¬ºóÐøÒ²»á¶Ô½Ó C¡¢C++¡¢²Öò¡µÈÓïÑÔÒÔ±ãÀû ¸ü¶à¿ª·¢ÕßÐèÇó¡£MindSpore ¹úÄÚÈϿɶÈÅÅλµÚ¶þ£¬ÉçÇø»îÔ¾¶ÈÅÅλµÚËÄ£¬ÉçÇø¹æÄ£ÓÐÍû ½øÒ»²½Í»ÆÆ¡£Ëæ×Å MindSpore ѸËÙ·¢Õ¹£¬Öð½¥Îª¿ª·¢ÕßËù½ÓÊÜ¡£¸ù¾Ý¡¶ÖÐ ¹úÈ˹¤ÖÇÄÜ¿ò¼ÜÊг¡µ÷Ñб¨¸æ¡·Í³¼Æ£¬37%µÄ¿ª·¢ÕßÈÏΪ MindSpore ÊÇ ×îÊʺÏ×ö AI for science µÄ AI ¿ò¼Ü£¬ÅÅλµÚ¶þ£¬½ö´ÎÓÚ TensorFlow£»²¢±» 11%µÄ¿ª·¢ÕßÈÏΪÊÇÉçÇø»îÔ¾¶È±íÏÖ¸üºÃ£¬ÅÅλµÚËÄ£¬ºÍµÚÈýµÄ Paddle ÆëÍ·²¢½ø¡£¿¼Âǵ½ MindSpore ÊÇËĸö AI ¿ò¼ÜÖÐ×îÄêÇáµÄÒ»¸ö£¬ ÆäÉçÇø¹æÄ£ÓÐÍûʵÏÖеÄÍ»ÆÆ¡£3.2¡¢º®Îä¼Í£º¹úÄÚÁìÏ鵀 AI оƬÁúÍ·º®Îä¼ÍÊÇ AI оƬÁìÓòµÄ¶À½ÇÊÞ¡£¹«Ë¾³ÉÁ¢ÓÚ 2016 Äê 3 Ô 15 ÈÕ£¬ רעÓÚÈ˹¤ÖÇÄÜоƬ²úÆ·µÄÑз¢Óë¼¼Êõ´´Ð£¬²úÆ·¹ã·ºÓ¦ÓÃÓÚÏû·Ñµç×Ó¡¢ Êý¾ÝÖÐÐÄ¡¢ÔƼÆËãµÈÖî¶à³¡¾°¡£¹«Ë¾ÊÇ AI оƬÁìÓòµÄ¶À½ÇÊÞ£º²ÉÓù« ˾ÖÕ¶ËÖÇÄÜ´¦ÀíÆ÷ IP µÄÖÕ¶ËÉ豸Òѳö»õ¹ýÒŲ́£»ÔƶËÖÇÄÜоƬ¼°¼ÓËÙ ¿¨Ò²ÒÑÓ¦Óõ½¹úÄÚÖ÷Á÷·þÎñÆ÷³§É̵IJúÆ·ÖУ¬²¢ÒÑʵÏÖÁ¿²ú³ö»õ£»±ßÔµ ÖÇÄÜоƬ¼°¼ÓËÙ¿¨µÄ·¢²¼±êÖ¾×Ź«Ë¾ÒÑÐγÉÈ«Ãæ¸²¸ÇÔÆ¶Ë¡¢±ßÔµ¶ËºÍÖÕ ¶Ë³¡¾°µÄϵÁл¯ÖÇÄÜоƬ²úÆ·²¼¾Ö¡£È˹¤ÖÇÄܵĸ÷ÀàÓ¦Óó¡¾°£¬´ÓÔÆ¶ËÒç³öµ½±ßÔµ¶Ë£¬»òϳÁµ½ÖÕ¶Ë£¬¶¼Àë ²»¿ªÖÇÄÜоƬµÄ¸ßЧ֧³Å¡£¹«Ë¾ÃæÏòÔÆ¶Ë¡¢±ßÔµ¶Ë¡¢ÖÕ¶ËÍÆ³öÁËÈý¸öϵ Áв»Í¬Æ·ÀàµÄͨÓÃÐÍÖÇÄÜоƬÓë´¦ÀíÆ÷²úÆ·£¬·Ö±ðΪÖÕ¶ËÖÇÄÜ´¦ÀíÆ÷ IP¡¢ ÔÆ¶ËÖÇÄÜоƬ¼°¼ÓËÙ¿¨¡¢±ßÔµÖÇÄÜоƬ¼°¼ÓËÙ¿¨£¬ÆäÖÐÔÆ¶ËÖÇÄÜоƬÖ÷ ÒªÊÇÎªÔÆ¶ËÈ˹¤ÖÇÄÜ´¦ÀíÌṩǿ´óµÄ¼ÆËãÄÜÁ¦Ö§³Å£»ÔƶËÖÇÄܼÓËÙ¿¨ÊÇ »ùÓÚÔÆ¶ËÖÇÄÜоƬ£¬Ôö¼ÓÍâΧµç·ģ¿éÐγɵĿ¨°å²úÆ·£¬Í¨¹ýÖ÷»úµÄ¸½ ¼Ó½Ó¿Ú½ÓÈëϵͳ¡£º®Îä¼ÍÔÆ¶ËÍÆÀíÖ÷Òª°üº¬ 8 ¸ö²úÆ·£¬Ä¿Ç°µü´úÖÁ MLU370 ϵÁУ¬×î´ó·åÖµËãÁ¦¸ß´ï 256TOPS£¨INT8£©¡£º®Îä¼ÍÍÆÀíоƬ°üÀ¨ MLU100¡¢MLU270¡¢ MLU370 ºÍÐþ˼ 1001 µÈ 4 ¸öϵÁй² 8 ¸ö²úÆ·£¬ÆäÖÐ 2022 ÄêÍÆ³öµÄ MLU370 ϵÁлùÓÚ˫оƬËÄоÁ£Ë¼Ôª 370 ´òÔ졣˼Ԫ 370 оƬ²ÉÓà 7nm ÖÆ³Ì¹¤ÒÕ£¬ÊǺ®Îä¼ÍÊ׿ŲÉÓà chiplet оƬ¼¼ÊõµÄ AI оƬ£¬Ò²ÊǹúÄÚµÚ Ò»¿î¹«¿ª·¢²¼Ö§³Ö LPDDR5 ÄÚ´æµÄÔÆ¶Ë AI оƬ£»¹«Ë¾»¹»ùÓÚ 4 ÕÅ MLU370-X8 ²úÆ·¼¯³ÉÁËÐþ˼ 1001 ÖÇÄܼÓËÙÆ÷£¬ÒÔÔÚÉúÎïÐÅÏ¢¡¢Ò½ÁÆÓ° Ïñ¡¢ÓïÑÔÄ£Ð͵ÈÐÐÒµ¼°¿ÉÑØ³¤½­¹ã·ºÓ¦Óá£370 ϵÁÐÔÚ¸ßÃܶÈÔÆ¶ËÍÆÀíÁìÓò¾ßÓÐÃ÷ÏÔÓÅÊÆ¡£MLU370-X8 Ìṩ 256TOPS£¨INT8£©µÄ·åÖµËãÁ¦£¬¸ßÓÚӢΰ´ï L20¡£Í¬¹úÄÚÔÆ¶ËÍÆÀíоƬ Ïà±È£¬ÔÚ 150W ¹¦ºÄÍÆÀí¿¨ÖУ¬MLU370-X4 ·åÖµËãÁ¦ºÍÀ¥ÂØÐ¾ R200 ºÍ ìÝÔ­ I20Ò»Ö£¬Í¬Îª 256TOPS£¨INT8£©¡£ÔÚ¸ßÃܶÈÔÆ¶ËÍÆÀíÁìÓò£¬MLU370- S4 µÄÄܺıȸߴï 2.56£¬¾ßÓÐÏÔÖøÓÅÊÆ¡£È«ÃæÑз¢ÓÅ»¯ÍÆÀíÈí¼þƽ̨ģÐÍÐÔÄÜ¡¢´óÄ£ÐÍºÍ AIGC ÍÆÀíÒµÎñÖ§³Ö¡¢ ÍÆÀíÐÔÄÜÓÅ»¯Èý¸ö·½Ã棬ÖúÁ¦¿Í»§½µ±¾ÔöЧ¡£Ä£ÐÍÐÔÄÜÓÅ»¯·½Ã棬º®Îä ¼ÍÕë¶ÔÓïÒôºÏ³É¡¢ËÑË÷ÍÆ¼öºÍÊÓ¾õ´¦ÀíÖÐ¸ßÆµÊ¹ÓÃÍøÂç½øÐÐÁËÓÅ»¯£¬Ä¿ ǰ´ïµ½ÁË¿ÉÂäµØÒªÇó£»´óÄ£ÐÍºÍ AIGC ÍÆÀíÒµÎñÖ§³Ö·½Ã棬º®Îä¼ÍÑз¢ ´óÓïÑÔÄ£ÐÍ·Ö²¼Ê½ÍÆÀí¼ÓËÙ¿â BangTransformer£¬½øÐÐÁË LLaMA¡¢GLM¡¢ BLOOM¡¢GPT-2 µÈÖ÷Á÷Éú³Éʽ´óÓïÑÔÄ£Ð͵ÄÊÊÅ乤×÷£»ÔÚÍÆÀíÐÔÄÜÓÅ »¯·½Ã棬BangTransformer Ö§³ÖËã×ÓÈںϡ¢ÕÅÁ¿²¢ÐС¢Á¿»¯ÍÆÀí¡¢Flash Attention µÈÓÅ»¯ÌØÐÔ£¬ÓÃÓÚ¸¨ÖúͼÏñÉú³ÉµÄ MagicMind ÊÇÒµ½çÊ׸ö»ù ÓÚ MLIR ͼ±àÒë¼¼Êõ´ïµ½ÉÌÒµ»¯²¿ÊðÄÜÁ¦µÄÍÆÀíÒýÇæ£¬ÔÚ¹¦ÄÜ¡¢ÐÔÄÜ¡¢ ¼æÈÝÐÔÉ϶¼ÓÐÁ¼ºÃ±íÏÖ£¬Í¬Ê±»ùÓÚ MagicMind µ½ PyTorch µÄ¼¯³É£¬¿Í»§ ÎÞÐè´úÂëÇ¨ÒÆÒ²Äܹ»ÏíÊÜ MagicMind ´øÀ´µÄÐÔÄܼÓËÙ£¬Í¬Ê±£¬MagicMind ÐÂÔöÁ˶à¿îÔÆ¡¢±ß¡¢¶Ë¡¢³µÓ²¼þƽ̨֧³Ö£¬²¢ÍêÉÆÁË Sample Code¡¢Best Practice µÈÓû§Îĵµ£¬½øÒ»²½Ìá¸ßÁËÓû§Ê¹ÓÃÌåÑé¡£ÍÆÀíÈí¼þƽ̨Èý¸ö ά¶ÈµÄÑз¢ÓÅ»¯£¬´ó·ùÌáÉýÁËÍÆÀíÒµÎñÔËÐÐЧÂÊ£¬ÖúÁ¦¿Í»§½µ±¾ÔöЧ¡£2022-2023 Ä꺮Îä¼Í½ÓÁ¬»ñÒÚ¼¶¶©µ¥¡£½ØÖÁ 2023 Äê 12 Ô£¬ÖйúÒÆ¶¯ÒÑ ÓÐ 12 ¸öÊ¡¹«Ë¾¡¢³¬¹ý 70 ¸ö AI ÒµÎñÍê³ÉÏòº®Îä¼Í˼Ԫ£¨MLU£©ÏµÁÐÔÆ ¶ËÖÇÄܼÓËÙ¿¨µÄÇ¨ÒÆ£¬²¢ÔÚ¿ÉÐÐÐÔ¡¢Ò×ÓÃÐÔ¡¢ÔËËãÐÔÄÜ·½ÃæµÃµ½ÁËÁ¼ºÃ ·´Ï죬ʵ²âÖг¬Ô½¹ú¼ÊÖ÷Á÷²úƷˮƽ¡£2023 ÄêÄÚ£¬º®Îä¼ÍÏȺóÖбꡰÉò ÑôÊÐÆû³µ³ÇÐÂÐÍ»ù´¡ÉèÊ©½¨ÉèÏîÄ¿-ÖÇÄܼÆËãÖÐÐÄ¡±ºÍ¡°Õã¶«ÄÏÊý×Ö¾­¼Ã²úÒµÔ°Êý×Ö»ù´¡ÉèÊ©ÌáÉý¹¤³Ì£¨Ò»ÆÚ£©¡±Á½¸öÏîÄ¿£¬Ìṩ°üÀ¨µ«²»ÏÞÓÚÖÇÄÜ ¼ÆËã×Óϵͳ¡¢Êý¾Ý´æ´¢×Óϵͳ¡¢ÍøÂç½»»»×Óϵͳ¡¢Èí¼þƽ̨¡¢¼¯³É·þÎñ ºÍά±£·þÎñµÈ£¬ºÏ¼Æ¹±Ï×ÓªÊÕ´ï 9.08 ÒÚÔª¡£2022 Ä꣬º®Îä¼ÍÖбꡰÄϾ© ÖÇÄܼÆËãÖÐÐÄÏîÄ¿£¨¶þ¡¢ÈýÆÚ£©¡±ÏîÄ¿£¬¹±Ï×ÓªÊÕ 4.43 ÒÚÔª¡£ º®Îä¼ÍÊг¡ÈϿɶȳÖÐøÌáÉý£¬Ç©Êð¶à¸öÈ˹¤ÖÇÄÜÁìÓòºÏ×÷ЭÒé¡£2022- 2023 Ä꣬º®Îä¼ÍÏȺóÓë°Ù´¨ÖÇÄÜ¡¢Öе繤³Ì¡¢ÌìÍ«ÍþÊÓ´ï³ÉÕ½ÂÔºÏ×÷¡£ Ŀǰ£¬º®Îä¼ÍÒÑͬ°Ù´¨ÖÇÄÜÆìϵĴóÄ£ÐÍ Baichuan2-53B¡¢Baichuan2- 13B¡¢Baichuan2-7B µÈÒÑÍê³ÉÈ«ÃæÊÊÅ䣬ÖúÁ¦º®Îä¼Í˼Ԫ£¨MLU£©ÏµÁÐ ²úÆ·ÐÔÄܾù´ïµ½¹ú¼ÊÖ÷Á÷²úÆ·µÄˮƽ¡£´ËÍ⣬¹«Ë¾ÔƶËÓ²¼þ²úÆ·¶áµÃ¶à ¸ö½±Ï2018 Äê 11 Ô£¬ÓÚÉîÛÚ¾Ù°ìµÄµÚ¶þÊ®½ìÖйú¹ú¼Ê¸ßм¼Êõ³É¹û ½»Ò×»áÉÏ£¬º®Îä¼Í˼Ԫ 100 ÖÇÄÜоƬ¡¢Ë¼Ôª 100 ¼ÓËÙ¿¨Á¬ÐøÕ¶»ñ¸ß½»»á ×éί»á°ä·¢µÄ¡°ÓÅÐ㴴вúÆ·½±¡±£» 2019 Äê 10 Ô£¬Ë¼Ôª 270 оƬ»ñµÃµÚ Áù½ìÎÚÕòÊÀ½ç»¥ÁªÍø´ó»á¡°ÊÀ½ç»¥ÁªÍøÁìÏȿƼ¼³É¹û½±¡±£»2021 Äê 7 Ô£¬ ¹«Ë¾µÄ˼Ԫ 290 ÖÇÄÜоƬ¼°¼ÓËÙ¿¨¡¢Ðþ˼ 1000 ÖÇÄܼÓËÙÆ÷»ñµÃÁËÓÉÊÀ ½çÈ˹¤ÖÇÄÜ´ó»á×éί»á°ä·¢µÄ SAIL Ö®Ðǽ±£¬º®Îä¼ÍÓ°ÏìÁ¦³ÖÐøÌáÉý¡£3.3¡¢º£¹âÐÅÏ¢£º¹ú²ú CPU+DCU ÁúÍ·¹«Ë¾¹«Ë¾»ñ AMD ÊÚȨ£¬X86 Ö¸ÁÉú̬»·¾³·á¸»¡£¹«Ë¾³ÉÁ¢ÓÚ 2014 Ä꣬Ö÷ ÓªÒµÎñΪÑз¢¡¢Éè¼ÆºÍÏúÊÛÓ¦ÓÃÓÚ·þÎñÆ÷¡¢¹¤×÷Õ¾µÈ¼ÆËã¡¢´æ´¢É豸ÖÐ µÄ¸ß¶Ë´¦ÀíÆ÷ CPU ÒÔ¼°Éî¶È¼ÆËã´¦ÀíÆ÷ DCU µÈ¡£¹«Ë¾²úÆ·»ùÓÚ AMD ÊÚȨ¼¼Êõ£¬¼æÈÝÊг¡Ö÷Á÷µÄ x86 Ö¸Á£¬¾ßÓгÉÊì¶ø·á¸»µÄÓ¦ÓÃÉú̬»· ¾³¡£Í¬Ê±£¬º£¹â´¦ÀíÆ÷ÄÚÖÃרÓð²È«Ó²¼þ£¬Ö§³Ö¶àÖÖÏȽøµÄ©¶´·ÀÓù¼¼ Êõ£¬ÄÚÖøßÐÔÄܵĹúÃÜЭ´¦ÀíÆ÷ºÍÃÜÂëÖ¸Á£¬Ö§³Ö¿ÉÐżÆËãµÄ¹úÄÚ¡¢ ¹ú¼Ê±ê×¼£¬Ö§³ÖÁìÏȵĻúÃܼÆËã¼¼Êõ£¬Äܹ»½øÐÐÖ÷¶¯°²È«·ÀÓù£¬Í¨¹ýÁË Ïà¹ØÈ¨Íþ»ú¹¹µÄ°²È«²âÊÔ£¬Âú×ãÐÅÏ¢°²È«¡¢Êý¾ÝÒªËØ°²È«Á÷ͨµÄ·¢Õ¹Ðè Çó¡£¹«Ë¾µÄ²úÆ·°üÀ¨º£¹âͨÓô¦ÀíÆ÷£¨CPU£©ºÍº£¹âЭ´¦ÀíÆ÷£¨DCU£©¡£º£ ¹â CPU ϵÁвúÆ·¼æÈÝ x86 Ö¸ÁÒÔ¼°¹ú¼ÊÉÏÖ÷Á÷²Ù×÷ϵͳºÍÓ¦ÓÃÈí¼þ£¬ ÈíÓ²¼þÉú̬·á¸»£¬ÐÔÄÜÓÅÒ죬°²È«¿É¿¿¡£¹«Ë¾ CPU ¸ù¾Ý¸ßÖеͶËÓ¦Óó¡ ¾°·ÖΪ 7000¡¢5000¡¢3000 Èý¸öϵÁУ¬¸ù¾Ý²úÆ·´ú¼Ê¸÷ϵÁвúÆ·ÓÖ·ÖΪ Ò»¶þÈýËĺŲúÆ·£¬Ä¿Ç°¹«Ë¾Ö÷ÒªÏúÊÛ¶þ¡¢Èý´ú²úÆ·£¬Ëĺš¢ÎåºÅ²úÆ·ÔÚ Ñз¢ÖУ¬Ô¤¼ÆÃ÷ÄêËĺŲúƷʵÏÖ³ö»õ¡£ÆäÖÐ 7000 ϵÁÐÖ÷ÒªÓÃÓڸ߶˴¦ ÀíÆ÷£¬Öж˲úÆ·Ö÷ÒªÓÃÓÚÖеͶ˷þÎñÆ÷£¬µÍ¶Ë²úÆ·Ö÷ÒªÓÃÓÚ±ßÔµ¼ÆËã¡£º£¹â DCU ϵÁвúÆ·ÒÔ GPGPU ¼Ü¹¹Îª»ù´¡£¬¼æÈÝͨÓõġ°Àà CUDA¡±»· ¾³£¬¿É¹ã·ºÓ¦ÓÃÓÚ´óÊý¾Ý´¦Àí¡¢È˹¤ÖÇÄÜ¡¢ÉÌÒµ¼ÆËãµÈÓ¦ÓÃÁìÓò¡£º£¹â DCU ϵÁвúÆ·°üÀ¨ Z\K\E ϵÁУ¬ÉîËãÒ»ºÅΪ Z ϵÁУ¬E ´ú²úÆ·Ïà½ÏÓÚ K ´ú²úÆ·ÐÔÄÜ·­±¶£¬K ´ú²úÆ·Ïà½ÏÓÚ Z ´ú²úÆ··­±¶¡£Ä¿Ç° Z100L ÒÑʵÏÖ³ö »õ£¬E ϵÁÐÔÚÑÐÖС£¹«Ë¾²úÆ·¸²¸Ç¸ßÖеͶ˸÷Àೡ¾°£¬ÏÂÓÎÐÐÒµ°üÀ¨µçÐÅ¡¢½ðÈÚ¡¢»¥ÁªÍøµÈ¡£ 2019 Ä꣬¹«Ë¾Ö÷ÒªÏúÊÛÒ»´ú CPU ²úÆ·£¬ÒÔ 7100 ϵÁÐΪÖ÷£¬ÃæÏò¸ß¶Ë ·þÎñÆ÷Êг¡¡£ÒòΪ¹ú¼Ò¼¶½ÌÓý¿ÆÑÐÏîÄ¿ÖпÆÔº´óÆøËù¡°Ä£ÄâÆ÷×°Öá±ÏîÄ¿ ²É¹º´¦ÀíÆ÷£¬ËùÒÔ½ÌÓýÁìÓòÕ¼±È½Ï¶à¡£2020 Ä꣬¹«Ë¾ÍƳöº£¹â¶þºÅϵÁÐ ²úÆ·£¬ÊÜÒæÓÚǰÆÚÈÏÖ¤²âÊÔ£¬¹«Ë¾ÔÚµçÐÅÔËÓªÉ̼¯²É¡¢½ðÈÚÐÐÒµµÈÊг¡ ·Ý¶î¿ìËÙÔö³¤¡£ÆäÖÐ 5200 ϵÁвúÆ·ÍÆ³öºó¼´½øÈëµ³ÕþÁìÓòרÏîĿ¼£¬ ÏúÊÛ¿ìËÙÔö³¤¡£2021 Ä꣬µçÐÅ¡¢½ðÈÚÐÐÒµÐèÇóÔö³¤½Ï¿ì£¬¹«Ë¾²úÆ·½øÈë ¸üл»´úʱµã¡£¹«Ë¾ 7200¡¢3200 ϵÁвúƷͬʱ½øÈëµ³ÕþÁìÓòרÏîĿ¼£¬ 7200 ϵÁвúÆ·²¿·ÖÈ¡´ú 5200 ϵÁУ¬3200 ϵÁÐÔö³¤½Ï¿ì£¬3100¡¢5100 ϵÁвúÆ·½øÈëÏúÊÛÄ©ÆÚ¡£2021 ÄêϰëÄ꣬¹«Ë¾ 8000 ϵÁÐ DCU ²úƷʵÏÖÁ¿²ú£¬Ö÷ÒªÃæÏò·þÎñÆ÷¼¯Èº»òÊý¾ÝÖÐÐÄÊг¡£¬½øÒ»²½·á¸»Á˹«Ë¾µÄ²ú Æ·Ïß¡£¹«Ë¾ CPU ²úÆ·º£¹âÒ»ºÅ¡¢¶þºÅ¡¢ÈýºÅÒѾ­ÊµÏÖÉÌÒµ»¯Ó¦Ó᣹«Ë¾ CPU ²úÆ··¢Õ¹Â·¾¶¿É·ÖΪ£º¢Ù º£¹âÒ»ºÅ»ùÓÚ AMD ÊÚȨ¼¼Êõ£¬ÓÚ 2018 Äê 4 ÔÂʵÏÖÁ¿²ú¡£¢Ú¹«Ë¾ÔÚº£¹âÒ»ºÅ»ù´¡ÉÏ£¬¶Ô Core ΢½á¹¹½øÐÐÓÅ»¯£¬ÌáÉý ´¦ÀíÆ÷ºËÐÄÐÔÄܺͰ²È«Ó¦ÓÃÐÔÄÜ£¬º£¹â¶þºÅÓÚ 2020 ÄêʵÏÖÁ¿²ú¡£¢Û»ù ÓÚº£¹â¶þºÅ CPU£¬¹«Ë¾¶ÔºËÐÄºÍÆ¬ÉÏÍøÂç΢½á¹¹½øÐÐÉè¼ÆÓÅ»¯£¬»ùÓÚРµÄ¹¤ÒÕ½Úµã½øÐÐÉè¼Æ£¬º£¹âÈýºÅÓÚ 2022 ÄêʵÏÖÁ¿²ú¡£Ä¿Ç°º£¹âÈýºÅÒÑ ³ÉΪÖ÷Á¦ÏúÊÛ²úÆ·£¬º£¹âËĺš¢ÎåºÅÈÔÔÚÑз¢µ±ÖС£´ËÍ⣬º£¹â CPU °´ ÕÕ´ú¼Ê½øÐÐÉý¼¶µü´ú£¬Ã¿´ú¼Ê²úÆ·°´ÕÕ²»Í¬Ó¦Óó¡¾°¶Ô¸ß¶Ë´¦ÀíÆ÷¼ÆËã ÐÔÄÜ¡¢¹¦ÄÜ¡¢¹¦ºÄµÈ¼¼ÊõÖ¸±êµÄÒªÇó£¬Ï¸·ÖΪº£¹â 7000 ϵÁвúÆ·£¨×î¶à ¼¯³É 32 ¸ö´¦ÀíÆ÷ºËÐÄ£©¡¢º£¹â 5000 ϵÁвúÆ·£¨×î¶à¼¯³É 16 ¸ö´¦ÀíÆ÷ ºËÐÄ£©¡¢º£¹â 3000 ϵÁвúÆ·£¨×î¶à¼¯³É 8 ¸ö´¦ÀíÆ÷ºËÐÄ£©¡£º£¹â CPU ÊÊÅäÖ÷Á÷Éú̬£¬Òѵõ½À˳±¡¢ÁªÏ롢лªÈý¡¢Í¬·½µÈ¶à¼Ò¹úÄÚ ÖªÃû·þÎñÆ÷³§É̵ÄÈϿɡ£¹«Ë¾ CPU ¼æÈݹú¼ÊÖ÷Á÷ x86 ´¦ÀíÆ÷¼Ü¹¹ºÍ¼¼ Êõ·Ïߣ¬¾ßÓÐÓÅÒìµÄÉú̬ÓÅÊÆ¡£¹«Ë¾²úÆ·º£¹â CPU7285 µÄ SPEC CPU 2017 ʵ²âÐÔÄÜÓë¹ú¼ÊÁìÏÈоƬÉè¼ÆÆóÒµ Intel ͬÆÚ·¢²¼µÄÖ÷Á÷´¦ÀíÆ÷ ²úÆ·µÄʵ²âÐÔÄÜ×ÜÌåÏ൱£¬¾ß±¸Á¼ºÃµÄ²úÆ·ÐÔÄÜ¡£GPU ¾ÞÍ·Ö®Õù£º¼Ü¹¹ÏȽøÐÔÓëÉú̬¡£´ÓӢΰ´ïºÍ AMD µÄ¾ºÕùÀ´¿´£¬GPU µÄºËÐÄÔÚÓڼܹ¹µÄÏȽøÐÔºÍÍêÉÆµÄÉú̬¡£¼Ü¹¹ÏȽøÐÔ·½Ã棬Ӣΰ´ïÿÁ½ Äê»á¸üÐÂÒ»´Î¼Ü¹¹£¬Ã¿´Îµü´ú¶¼ÒâζןüÏȽøµÄÖÆ³Ì¡¢¸ü¶àµÄ¼ÆËã´¦Àí µ¥Ôª¡£Éú̬·½Ã棬CUDA ·¢Õ¹ÖÁ½ñÒѾ­½¨Á¢ÁËÇ¿´óµÄÉú̬Ìåϵ¡£Éú̬µÄ ±¾ÖÊÊǶÔÓû§**¹ßµÄÅàÑø£¬CUDA Ç¿´óµÄÈí¼þ¸²¸ÇÂÊºÍ AI Ö§³Ö¿ò¼Üʹ ÆäÄÑÒÔÌæ´ú£¬AMD Ìá³öµÄ ROCm ×îÓÐÏ£ÍûÌæ´ú CUDA¡£Óɴ˿ɼû£¬ÄÜ Í¬Ê±ÊÊÅä CUDA µÈ¶àÖÖÉú̬ÇÒÐÔÄÜÓÅÒìµÄ GPU ½«¾ßÓиüÇ¿µÄ¾ºÕùÁ¦¡£¹«Ë¾²úÆ·ÐÔÄÜÓÐÍû¶Ô±êӢΰ´ï A100¡£¹«Ë¾ÉîËãÒ»ºÅ DCU ²ÉÓà 7nm ¹¤ ÒÕ£¬ÔÚµäÐÍÓ¦Óó¡¾°ÖУ¬ÐÔÄÜæÇÃÀӢΰ´ï A100 ºÍ AMD MI100¡£¹«Ë¾ DCU È«Ãæ¼æÈÝ ROCm GPU ¼ÆËãÉú̬£¬Äܹ»½ÏºÃµØÊÊÅä¹ú¼ÊÖ÷Á÷ÉÌÒµ¼Æ ËãÈí¼þ£¬½â¾öÁ˲úÆ·ÍÆ¹ã¹ý³ÌÖеÄÈí¼þÉú̬¼æÈÝÐÔÎÊÌ⣬¾ß±¸Á¼ºÃµÄÉú ̬ÊÊÅäÄÜÁ¦¡££¨±¾ÎĽö¹©²Î¿¼£¬²»´ú±íÎÒÃǵÄÈκÎͶ×ʽ¨Òé¡£ÈçÐèʹÓÃÏà¹ØÐÅÏ¢£¬Çë²ÎÔı¨¸æÔ­ÎÄ¡££©¾«Ñ¡±¨¸æÀ´Ô´£º¡¾Î´À´Öǿ⡿¡£
ÔðÈα༭£ºµÂÇÚ¸ÖÌúÍø ±êÇ©£º

ÈÈÃÅËÑË÷

Ïà¹ØÎÄÕÂ

¹ã¸æ
µÂÇÚ¸ÖÌúÍø |Êг¡·ÖÎö

¹ú²ú°ëµ¼Ìå¼¼Êõ£¬¹ú²ú°ëµ¼ÌåÉè±¸Í»ÆÆ

chanong

|

£¨±¨¸æ×«Ð´/×÷ÕߣºÖÐ̩֤ȯ¡¢Íõ·¼¡¢ÑîÐñ¡¢ÀîÑ©·å£©

1.´óÐÍ»úÐÍ·¢Õ¹½«¹ÄÀøÓ²¼þÉý¼¶£¬ÐèÇóºÍÕþ²ß½«¹ÄÀø¹ú²úÌæ´ú1.1.¹ú²ú¼ÆËãÄÜÁ¦´ó£¬¹ú²ú»¯Âʵͣ¬¿Õ¼ä¹ãÀ«£¬¼ÆËãÄÜÁ¦ÓÐÏÞ£¬ÊÇδÀ´¾­¼Ã·¢Õ¹µÄ»ù´¡¡£¼ÆËãÄÜÁ¦¶Ô¹úÃñ¾­¼ÃµÄ·¢Õ¹Ó°ÏìºÜ´ó¡£¸ù¾ÝIDC ¡¶2021- 2022 È«Çò¼ÆËãÁ¦Ö¸ÊýÆÀ¹À±¨¸æ¡·Êý¾Ý£¬Æ½¾ùËãÁ¦Ã¿Ìá¸ßÒ»µã£¬Êý×Ö¾­¼ÃºÍGDP·Ö±ðÔö³¤3.5%ºÍ1.8%¡£ËãÁ¦×÷ΪÊý×Ö¾­¼Ãʱ´úµÄ¹Ø¼üÉú²úÁ¦ÒªËØ£¬ÒѳÉΪÊý×Ö¾­¼Ã·¢Õ¹µÄºËÐÄÖ§³ÅºÍÇý¶¯Á¦¡£µ±Ò»¸ö¹ú¼ÒµÄ¼ÆËãÄÜÁ¦Ö¸Êý´ïµ½40/60·Ö»ò¸ü¸ßʱ£¬GDPÔö³¤µÄÍÆ¶¯Á¦½«Ôö¼Ó1.5/3±¶¡£´ÓÏÂÓÎϸ·ÖÀ´¿´£¬È˹¤ÖÇÄܼÆËãºÍ±ßÔµ¼ÆËãÊÇÊг¡Ôö³¤µÄ¹Ø¼üÇý¶¯Á¦£¬½«ÒýÁìËãÁ¦ÊµÏÖеĿìËÙÔö³¤¡£ÎÒ¹úËãÁ¦Êг¡¿Õ¼ä¾Þ´ó£¬¹ú²ú»¯ÂÊÓÐÍû¿ìËÙÌáÉý¡£Õþ²ß·½Ã棬ÎÒ¹úÏȺ󷢲¼ÁË¡¶È«¹úÒ»Ì廯´óÊý¾ÝÖÐÐÄЭͬ´´ÐÂÌåϵËãÁ¦ÊàŦʵʩ·½°¸¡·¡¢¡¶ËãÁ¦»ù ´¡ÉèÊ©¸ßÖÊÁ¿·¢Õ¹Ðж¯¼Æ»®¡·¡¢¡¶¡°Ê®ËÄÎ塱Êý×Ö¾­¼Ã·¢Õ¹¹æ»®¡·µÈһϵÁÐÎļþÍÆ¶¯¼ÆËã»ù´¡ÉèÊ©½¨Éè¡£´ËÍ⣬¹ú¼ÒÕýÔÚ¶àµØÍÆ½øÖÇÄܼÆËãÖÐÐĽ¨É裬Öð²½Óɶ«ÏòÎ÷À©Õ¹¡£Ä¿Ç°£¬ÎÒ¹úÒÑÓÐ30¶à¸ö³ÇÊÐÕýÔÚ½¨Éè»òÄ⽨ÖÇÄܼÆËãÖÐÐÄ¡£´ËÍ⣬¸ù¾Ý¿Æ¼¼²¿·¢²¼µÄÕþ²ßÒªÇ󣬡°ÔÚ»ìºÏ²¿ÊðµÄ¹«¹²ËãÁ¦Æ½Ì¨ÖУ¬¹ú²úоƬÌṩµÄËãÁ¦¼ÛÖµÃûÒåÉϳ¬¹ý60%£¬¹ú²ú¿ª·¢¿ò¼ÜÓ¦ÓÅÏÈ¿¼ÂÇ¡±¡£¿¼Âǵ½AIоƬµÄʹÓã¬Ê¹ÓÃÂÊÒª´ïµ½60%ÒÔÉÏ¡£¡±¹úÄÚAIÉøÍ¸ÂÊÓÐÍû¿ìËÙÌáÉý¡£ IDCÊý¾ÝÏÔʾ£¬Î´À´ÎÒ¹úÖÇÄܼÆËãÄÜÁ¦½«¿ìËÙÔö³¤£¬2021ÄêÖÁ2026ÄêÎÒ¹úÖÇÄܼÆËãÄÜÁ¦Ä긴ºÏÔö³¤ÂÊÔ¤¼Æ½«´ïµ½52.3%¡£ FLOPS£¨Floating Point Operations Per Second£©ÊÇÿÃ븡µãÔËËãµÄ´ÎÊý£¬´ú±í¸¡µãÔËËãµÄËÙ¶È¡£¸¡µã¼ÆÊýʹÓø¡µãÊýʹÓò»Í¬³¤¶ÈµÄ¶þ½øÖÆÊý×ÖÀ´±íʾÊý×Ö¡£Ò»°ãÓÃ4¸ö×Ö½Ú£¬¼´32λµÄ¶þ½øÖÆÊýÀ´±íʾÊý×Ö¡£Òò´Ë£¬FP32/FP64/FP16·Ö±ð´ú±íµ¥¾«¶È¡¢Ë«¾«¶È¡¢°ë¾«¶È¡£ FP64³£ÓÃÓÚÐèÒª¸ß¾«¶ÈµÄ¿ÆÑ§¼ÆËãºÍ³¬¼¶¼ÆË㣬FP32ºÍFP16Ö÷ÒªÓÃÓÚAIÉî¶Èѧ**¡£

TF32ÊÇNVIDIAÌá³öµÄÌæ´úFP32µÄµ¥¾«¶È¸¡µã¸ñʽ¡£ TF32 (TensorFlow32) ÊÇNVIDIA A100 Ampere ¼Ü¹¹GPU ÉϵÄÒ»ÖÖÐÂÊý¾ÝÀàÐÍ£¬ËüʹÓÃÓë°ë¾«¶È(FP16) ÔËËãÏàͬµÄ10 λβÊý¾«¶È¡£Õâ¸ö¾«¶ÈˮƽԶԶ³¬¹ýÁËÈ˹¤ÖÇÄܹ¤×÷¸ºÔصľ«¶ÈÒªÇó¡£Í¬Ê±£¬TF32²ÉÓÃÓëFP32ÏàͬµÄ8λָÊý룬¿ÉÒÔÖ§³ÖÓëFP32ÏàͬµÄÊý×Ö·¶Î§£¬ÔÚÐÔÄÜ¡¢·¶Î§ºÍ¾«¶ÈÖ®¼äÌṩÁËÁ¼ºÃµÄƽºâ¡£ NVIDIA API ¿âÔÊÐíÓû§ÔÚÆäÓ¦ÓóÌÐòÖгä·ÖÀûÓÃTF32£¬¶øÎÞÐè½øÐÐÈκδúÂë¸ü¸Ä¡£ TF32 Tensor Core »ùÓÚFP32 ÊäÈëÖ´ÐмÆËã²¢Éú³ÉFP32 ¸ñʽµÄ½á¹û¡£Í¨¹ý½µµÍ¾«¶È£¬TF32 ÖÐеĵ¥¾«¶ÈÊý¾ÝÀàÐÍÈ¡´úÁËFP32 ÖÐԭʼµÄµ¥¾«¶ÈÊý¾ÝÀàÐÍ¡£Õâ¼õÉÙÁËÊý¾ÝÕ¼ÓõĿռ䣬²¢ÔÚÏàͬµÄÓ²¼þÌõ¼þÏÂÔÊÐí¸ü¶à¡¢¸ü¿ìµÄ²Ù×÷¡£ 2024ÄêÖÁ2025Ä꣬ÎÒ¹úËãÁ¦¹æ»®ÔöËÙ½«³¬¹ý100EFLOPS£¬Ï൱ÓÚAIËãÁ¦Ð¾Æ¬Êг¡¹æÄ£³¬¹ý2600ÒÚÔª¡£ 2023Äê10Ô£¬³ÉÁ¢¹¤ÒµºÍÐÅÏ¢»¯²¿¡¢ÖÐÑëÍøÐŰ졢½ÌÓý²¿¡¢¹ú¼ÒÎÀÉú½¡¿µÎ¯¡¢ÖйúÈËÃñÒøÐС¢¹ú×ÊίµÈ6¸ö²¿ÃÅ£¬Ìá³ö·¢Õ¹Á¿»¯Ö¸±êµ½2025Ä꣬Õë¶ÔËãÁ¦¡¢´æ´¢ÄÜÁ¦¡¢´æ´¢ÄÜÁ¦¡¢Ó¦ÓÃÔöÇ¿Ëĸö·½Ã棬Ìá³ö¡°µ½2025Ä꣬ÎÒ¹ú¼ÆËãÄÜÁ¦¹æÄ£´ïµ½300EFLOPS¡±¡¢¡°ÖÇÄܼÆËãÄÜÁ¦±ÈÖØ´ïµ½35%¡±¡£¾Ý¹¤ÒµºÍÐÅÏ¢»¯²¿²¿³¤½ð׳Áú½éÉÜ£¬8ÔÂ23ÈÕ£¬È«¹ú¼ÆËãÄÜÁ¦×ܹæÄ£´ïµ½197EFLOPS¡£¼ÙÉèδÀ´Á½ÄêÎÒ¹úËãÁ¦Ôö³¤Õ¼ÖÇÄÜËãÁ¦µÄ50%£¬¶ÔÓ¦µÄFP32ËãÁ¦Ï൱ÓÚ256Íò¿ÅA100×óÓÒ£¬Êг¡¹æÄ£Îª2600ÒÚ£¬Ô¤¼Æ³¬¹ýÔ­À´µÄ¡£ÎÒ¹úAIоƬÊг¡Ô¼Õ¼È«ÇòÊг¡µÄÈý·ÖÖ®Ò»¡£ÎÒ¹ú°ëµ¼Ìå²úÒµµÄÌØµãÊÇÊг¡¹æÄ£´ó¡¢¹ú²ú»¯Âʵͣ¬ÆäÖÐÒԸ߶ËÊý×ÖоƬ×îΪµäÐÍ¡£×ÜÌåÀ´¿´£¬¾ÝÆæÆæ×Éѯͳ¼Æ£¬ÖйúAIоƬÊг¡Ô¼Õ¼È«ÇòAIÊг¡µÄ30%ÖÁ40%£¬¶øÓ¢Î°´ïÊÇÈ«ÇòÁìÏȵÄGPU³§ÉÌ¡£ÒÔÆä²Æ±¨ÎªÀý£¬ÎÒ¹úÊÇNVIDIAµÄÖ÷ÒªÊÕÈëÀ´Ô´¡£ NVIDIA 2023 ²ÆÄêÖйú´ó½ӪҵÀûÈó´ïµ½58 ÒÚÃÀÔª£¬Õ¼×ÜÊÕÈëµÄ21.45%£¬¶ø2003 ²ÆÄ꣬Öйú´ó½ӪҵÀûÈó½öΪ2.4 ÒÚÃÀÔª£¬Õ¼×ÜÊÕÈëµÄ13%¡£Ëæ×ÅÎÒ¹úÈ˹¤ÖÇÄܲúÒµµÄ²»¶Ï·¢Õ¹ºÍÓ¦Óó¡¾°µÄ²»¶ÏÍØÕ¹£¬ÎÒÃÇÏàÐÅδÀ´¹úÄÚAIоƬÊг¡½«³ÖÐøÔö³¤¡£ GPUÊг¡µÄÂí̫ЧӦ¾Þ´ó£¬Ä¿Ç°ÎÒ¹ú¹ú²ú»¯ÂÊ»¹²»µ½10%¡£ÓÉÓÚÎÒ¹úоƬ²úÒµÆð²½½ÏÂý£¬¸ß¶ËоƬµÄ¼¼ÊõÍ»ÆÆÎÞ·¨Í¨¹ý¼òµ¥µÄ»ýÀÛÀ´ÊµÏÖ£¬Ä¿Ç°¹úÄÚоƬ¼¼ÊõÔ¶Ô¶ÂäºóÓÚÃÀ¹ú£¬Ôڸ߶ËоƬÁìÓòµÄÊг¡·Ý¶îµÍµÄ¡£´ÓÈ«Çò·¶Î§À´¿´£¬¾Ý»ª¾§²úÒµÑо¿ÔºÍ³¼Æ£¬NVIDIAÔÚ¶ÀÁ¢GPU¾ºÕùÊг¡ÉÏ´¦ÓÚ¢¶ÏµØÎ»£¬Êг¡·Ý¶î¸ß´ï88%£¬Âí̫ЧӦÏÔ×Å¡£´Ó¹úÄÚGPUÊг¡µ½ÔÆÐã×ʱ¾£º010 -30000 ͳ¼ÆÏÔʾ£¬¹úÄÚGPUÊг¡ËäÈ»¾Þ´ó£¬µ«Ä¿Ç°¹ú²ú»¯Âʲ»×ã10%£¬Ø½´ýÌáÉý£¬¹úÄÚAI»¹Óкܴó¿Õ¼äÐ¾Æ¬ÖÆÔìÉÌ¡£ 1.2.ÃÀ¹ú½ûÁî³ÖÐøÉý¼¶£¬¹ú²úËãÁ¦Öû»¼ÓËÙÃÀ¹úAI½ûÁîÔÙ´ÎÉý¼¶£¬GPU³É¿ØÖÆÖص㣬µ¹±Æ¹ú²ú»¯¼ÓËÙ¡£ 2023Äê10ÔÂ17ÈÕ£¬ÃÀ¹úÉÌÎñ²¿¹¤ÒµÓ밲ȫ¾Ö£¨BIS£©Ðû²¼¶ÔÖйúµÈ¹ú¼ÒµÄоƬºÍÈ˹¤ÖÇÄÜ·¢Õ¹½øÒ»²½ÏÞÖÆ£¬Ö÷Òª°üÀ¨¸ßÐÔÄÜËãÁ¦Ð¾Æ¬µÄ³ö¿ÚÏÞÖÆ¡£ÔÚ£¬À©´ó°ëµ¼ÌåÖÆÔì¹ÜÀí£¬²¢½«¸ü¶àÖйúGPUÆóÒµÌí¼Óµ½ÊµÌåÃûµ¥ÖС£

¾ßÌåϸ½ÚÈçÏ¡£ 1£©Ð¾Æ¬³ö¿Ú£ºÓÃÈý¸ö±ê×¼À´¶¨ÒåÄÄЩоƬ±»½ûÖ¹ÏòÖйú³ö¿Ú£¬°üÀ¨×ÜËãÁ¦£¨TPP£©¡¢Ð¾Æ¬ÐÔÄÜÃܶȣ¨PD£©ÒÔ¼°Ð¾Æ¬ÊÇ·ñÊÇÉè¼Æ»òÏúÊ۵ġ£ÓÃÓÚÊý¾ÝÖÐÐÄ¡£¸Ã½ûÁî½ûÖ¹ÏòÖйú³ö¿ÚA800ºÍH800µÈǰÖйúÌØ±ð°æGPU£¬Í¬Ê±Ò²Ó°Ïìµ½Ïû·Ñ¼¶GPU RTX 4090¡£ 2£©ÖÆÔì¿ØÖÆ£ºÀ©´ó¶ÔDUV¹â¿ÌÉ豸µÈ°ëµ¼ÌåÖÆÔìÉ豸µÄ¿ØÖÆ£¬²¢À©´óоƬÉè¼ÆÎļþµÄ´ú¹¤³§Éó²éµÄµØÓòÏÞÖÆ¡£ 3£©ÊµÌåÇåµ¥£ºÐÂÔö13¼ÒÖйúÆóÒµ£¬Ö÷ÒªÊDZØÈ˿Ƽ¼¡¢Ä¦¶ûÏ̵߳ÈGPUÆóÒµ£¬ÕâЩÆóÒµÐèÒª»ñµÃBISµÄÐí¿É²ÅÄÜÖÆÔìоƬ¡£¶àÄêÀ´£¬ÃÀ¹ú²»¶Ï³ǫ̈Ïà¹Ø·¨¹æºÍ½ûÁîÏÞÖÆÖйú´ó½°ëµ¼Ìå·¢Õ¹£¬°üÀ¨Õë¶ÔÐÔ´ò»÷¡¢¹úÄÚ²¹Ìù¡¢³ö¿Ú¹ÜÖÆµÈ´ëÊ©£¬´Ëǰ8ÔÂÔø°ä²¼¹ý¡°Çãµ¹½ûÁ¡£ºÍH800µ±Ê±¶¼ÔÚʹÓ᣽ûÁîºó·¢²¼µÄÖйúרÓÃGPU °æ±¾½µµÍÁ˼ÆËãÄÜÁ¦ºÍ»¥ÁªÍø´ø¿í£¬ÏÖÔÚÒ²Êܵ½ÏÞÖÆ¡£Ó¢Î°´ïÕë¶ÔÖйúÊг¡µÄרÓðæÐ¾Æ¬ÐÔÄܽøÒ»²½¶ñ»¯£¬×è°­Á˹úÄÚÈ˹¤ÖÇÄܵķ¢Õ¹¡£Õë¶ÔÃÀ¹úÐÂÒ»²¨µÄ½ûÖ¹ÐÔ·¨¹æ£¬NVIDIAÖ¼ÔÚ¿ª·¢·ûºÏÃÀ¹úÕþ¸®Õþ²ßÇÒ²»ÐèÒªÐí¿ÉµÄÐÂÐÍÊý¾ÝÖÐÐIJúÆ·£¬²¢¼Æ»®ÍƳöH20¡¢L20µÈÐͺš£¾ÝÌÚѶ¿Æ¼¼Ñ¶£¬¸ù¾ÝĿǰ¹«²¼µÄH20²ÎÊý¹æ¸ñ£¬µ¥¿¨ËãÁ¦Îª0.148P£¨FP16£©£¬Ô¼ÎªA100µÄ50%/H100µÄ15%£¬ÒÔ¼°6+1 HBM3e¡¢96GÈÝÁ¿£¬ NVLink Ôö¼Óµ½900G/s¡£ÓÉÓÚµ¥¿¨ËãÁ¦´ó·ù½µµÍ£¬¹úÄÚAI³§ÉÌÏà±ÈA/H800ÐèÒª²É¹º¸ü¶àµÄH20²ÅÄÜÂú×ãÄ£ÐÍѵÁ·ÐèÇó¡£ÁíÍ⣬H20µ¥¿¨ËãÁ¦½ÏµÍ£¬¿ÉÄÜÎÞ·¨Âú×ãǧÒÚ²ÎÊý¼¶LLMÄ£ÐÍѵÁ·µÄÒªÇ󣬵«¸üÊʺϴ¹Ö±Ä£ÐÍѵÁ·ºÍÍÆÀí¡£ÓÉÓÚµ¥¿¨ÐÔÄܲ»×ãÒÔ¼°×ʽðͶÈë¼Ó´ó£¬¹úÄÚAIÏÂÓγ§É̽«±»ÆÈ¼ÓËÙ¹ú²úÌæ´ú¡£ÊܽûÁîÓ°Ï죬Ӣΰ´ï2023ÄêµÚËļ¾¶ÈÔÚÖйú´ó½µÄÓªÊÕ½ÏÉϼ¾¶È´ó·ùϽµ¡£Êܳö¿ÚÏÞÖÆÓ°Ï죬NVIDIAÔÚÖйúÊг¡µÄÓªÊÕÖð½¥Î®Ëõ£¬¶ø2023ÄêµÚÈý¼¾¶È£¬NVIDIAÔÚÖйú´ó½µÄÓªÊÕ½«´ïµ½40.3ÒÚÃÀÔª£¬»·±ÈÔö³¤47%¡£ÊÕÈë½öΪ19.5 ÒÚÃÀÔª£¬±ÈÉÏÒ»¼¾¶ÈϽµ52%¡£µÚËļ¾¶È£¬Öйú´ó½ռӢΰ´ï×ÜÓªÊÕµÄ8.8%£¬´´Àúʷеͣ¬¹Ù·½Ô¤¼ÆÏÂÒ»¼¾¶ÈÕâÒ»·Ý¶î½«±£³ÖÔÚÕâÒ»·¶Î§ÄÚ¡£

¹ú²úAIоƬ½üÄêÀ´È¡µÃ³¤×ã½ø²½£¬ÃÀ¹úоƬ½ûÁîºÍ¹úÄÚ·¢Õ¹¸ü´óÐͺŵÄÐèÇóΪ¹ú²úÌæ´úÌṩÁËÐµĶ¯Á¦¡£Ä¿Ç°£¬¹úÄÚÖ÷ÒªAIоƬ³§Ḛ́üÀ¨»ªÎªº£Ë¼¡¢º®Îä¼Í¡¢º£¹âÐÅÏ¢¡¢±ØÈʿƼ¼¡¢ËÙÔ´¿Æ¼¼¡¢Ä½Ï£¼¯³Éµç·¡¢Ä¦¶ûÏ̡߳¢ÌìÊàÖÇÄÜоƬµÈ¡£Ò»Ð©¹ú²úÆì½¢ÒѾ­ÔÚËãÁ¦·½ÃæÕ¹¿ª¾ºÕù¡£ NVIDIA A100µÈÊÀ½çÁìÏȲúÆ·ÔÚÄÚ´æºÍ»¥Á¬·½ÃæÒ²½Ó½ü¹ú¼ÊÏȽøË®Æ½¡£¾Ý·͸É籨µÀ£¬NVIDIA H20µÄFP32ÐÔÄÜÔÚijЩ¹Ø¼üÁìÓò²»È绪ΪAscend 910B²úÆ·£¬µ«ÔÚ»¥Á¬ËÙ¶È·½ÃæÓÅÓÚ910B¡£¹úÄÚоƬ³§ÉÌÆ¾½èÓÅÒìµÄ²úÆ·ÐÔÄÜ£¬Öð½¥»ñµÃÏÂÓοͻ§µÄÈϿɡ£¾ÝÖйú»ù½ð±¨±¨µÀ£¬°Ù¶ÈÒѶ©¹º1600̨Ascend 910B£¬ÓÃÓÚ200̨·þÎñÆ÷¡£½ØÖÁ10ÔÂ23ÈÕ£¬»ªÎªÒÑÏò°Ù¶È½»¸¶Á˳¬¹ý60%µÄ¶©µ¥£¬¶ø¿Æ´óѶ·ÉÔÚ2023ÄêQ3²Æ±¨µç»°»áÒéÉϱíʾ£¬¸Ã¹«Ë¾ÔÚ2023Äê³õÓ뻪ΪAscend´ï³ÉÁËÌØ±ðЭÒé¡£Ëû±íʾ£¬ÒѾ­¿ªÊ¼Ñо¿£¬²¢ÒѽӽüÍê³É´ïµ½ÁË»ªÎª·¢²¼µÄAscend 910BµÄÐÔÄÜ¡£Äú¿ÉÒÔÕë¶ÔNVIDIA A100 ÔËÐлù×¼²âÊÔ¡£³ýÁË»ªÎªÉýÌÚÖ®Í⣬º®Îä¼ÍÔª590¡¢º£¹âÉñËãÈýºÅµÈ²úÆ·Ò²ÔÚ»ý¼«Íƹ㡣ÔÚÃÀ¹ú¶Ô»ªÖƲõÄѹÁ¦Ï£¬ÎÒÃÇÈÏΪH20ÊǺìÏßÒÔÄÚ¹ú²úÄÜÂòµ½µÄ×î¸ßµÈ¼¶Ð¾Æ¬£¬¶øÇÒËæ×Źú²úоƬµÄ²»¶Ïµü´ú£¬Äܹ»³¬Ô½ÆäÐÔÄÜЧ¹û£¬Èùú²úµçÄÔÖµµÃÆÚ´ýÄÜÁ¦»ù´¡ÉèÊ©½«»áµÃµ½¸ÄÉÆ¡£

Llama-2×ܹ²Ê¹ÓÃÁË32²ã½âÂëÆ÷£¬²¢ÔÚԭʼLlama-1µÄ»ù´¡ÉϽøÒ»²½´´Ð¡£ 1£©¼Ì³ÐLlama-1µÄѵÁ·Îȶ¨ÐÔÓÅÊÆ£ºÔÚdecoder²ã£¬½«transformerµÄ²ã·¶ÊýÌæ»»Îª£º RMS ·¶Êý¿ÉÌá¸ßѵÁ·Îȶ¨ÐÔ¡£¸ù¾ÝÂÛÎÄ¡¶ËãÁ¦»ù´¡ÉèÊ©¸ßÖÊÁ¿·¢Õ¹Ðж¯¼Æ»®¡·£¬RMS Norm ¿ÉÒÔ¼õÉÙ¼ÆËãʱ¼ä7% µ½64%£»2£©ÀûÓÃLlama-1 µÄ¼ÆËãËÙ¶È£ºÎ»Öñ»RoPE È¡´ú£¨Ïà¶ÔλÖñàÂëºÍ¾ø¶ÔλÖñàÂë½áºÏÁËλÖñàÂëµÄÓŵ㣩 £¬¼È¿ìÓֿ죩£¬Ò×ÓÚÀ©Õ¹³¤¶È£¬¶Ôѧ**token¹ØÏµÓÐÒâÒ壩ҵ½çÁìÏȵıÕÔ´Ìá¸ß¼ÆËãËÙ¶ÈÏà±È½Ï´óµÄÄ£ÐÍ£¬Llama-2 70BÔÚ֪ʶºÍ½â¾öÎÊÌâ·½ÃæµÄ±íÏÖ¸üºÃ¡£¼¼ÄܺÍÊýѧÄÜÁ¦½Ó½üGPT-3.5¡£ MetaÔÚÆÀ¹ÀÖб£³ÖÁË×ã¹»µÄ¿Í¹ÛÐÔ£¬GPT-3.5/GPT-4´ÓOpenAI»ñµÃ½á¹û£¬PaLM/PaLM-2-L´ÓѧÊõÂÛÎÄ»ñµÃ½á¹û£¬×ÜÌåÓÅÓÚLlama-2£¬ÆÀ¹À½á¹ûÓÅÓÚPaLM ¡£ MMLU£¨¶àÈÎÎñÓïÑÔÀí½â¡¢ÖªÊ¶ºÍ½â¾öÎÊÌâÄÜÁ¦µÄÆÀ¹À£©ºÍGSM8K£¨ÊýѧÄÜÁ¦µÄÆÀ¹À£©ÓëGPT-3.5µÄ±íÏÖ½Ó½ü£¬µ«ÓëGPT-4/PaLMÈÔÈ»´æÔڽϴó²îÒì¡£ -2-L¡£ Llama-2Ìṩ7B/13B/30BÈý¸ö°æ±¾£¬Ãâ·ÑÉÌÓ㬿ÉÒÔÏÂÔØÊ¹Óá£Õýʽ¹æ¶¨ÁËÓëLlama-2 Ðí¿ÉÖ¤ºÍÄ£ÐÍ¿¨Ïà¹ØµÄÉÌÒµÏÞÖÆ¡£ 1£©Ðí¿É½ûÁîÃ÷È·½ûֹʹÓÃLlamaÊä³öºÍ½á¹ûÀ´ÔöÇ¿ºÍ¸Ä½øÆäËû´óÐÍÄ£ÐÍ£¬Llama-2¼°ÑÜÉú²úÆ·³ýÍ⣻2£©Ðí¿É½ûÁ¸½¼ÓÉÌÒµÌõ¿îÒªÇóÉÌҵƽ̨ӵÓг¬¹ý7ÒÚÿÔ¶¼»á½øÐÐMeta Ðí¿É»î¶¯£¬µ«Ö»ÒªËûÃÇÕâÑù×ö£¬¾Í¿ÉÒÔÕý³£Ê¹ÓÃLlama-2¡£3£©ÔÚÄ£ÐÍ¿¨Ê¹ÓÃÏÞÖÆÖУ¬ÎÒÃÇÌá³ö²»ÊÊÓÃÓÚÓ¢ÓïÒÔÍâµÄÓïÑÔ£¬ÕâÔÚLlama-2µÄÉÌÒµÏÞÖÆÖÐÊÇÓÐÕùÒéµÄ¡£Ö÷ÒªÔ­Òò¿ÉÄÜÊÇLlama-2ÓïÁÏ¿â´ó²¿·ÖÊÇÓ¢ÎÄ£¬ËµÃ÷Õâ¸öÄ£Ð͵ľÖÏÞÐÔ£¬¶øÁíÒ»·½Ãæ¹úÄÚ³§ÉÌÕýÔÚͨ¹ý¶þ´ÎѵÁ·¿ª·¢Llama-2ÑÜÉúÆ·£¬Äã¿ÉÒÔѵÁ·ÄãµÄÄ£ÐÍ¡£¹úÄÚ´ó¹æÄ£¿ªÔ´Ä£ÐÍÐÔÄÜÁ¼ºÃ£¬Ö§³ÖÃâ·ÑÉÌÓ㬽µµÍÁËAI·¢Õ¹Ãż÷¡£ Scholarè±ÓîInternLM ÊÇÉϺ£È˹¤ÖÇÄÜÑо¿ÔºÓëÉÌÌÀ¿Æ¼¼ÁªºÏ¶àËù¸ßУÁªºÏ·¢²¼µÄ´óÐÍÄ£ÐÍ£¬×îз¢²¼µÄInternLM2 ÓµÓÐ2.6 ÍòÒÚ´ú±ÒÓÃÓÚѵÁ·£¬°üÀ¨7B ºÍ20B ²ÎÊý¹æ¸ñ£¬²¢Ãâ·ÑÌṩÉÌÒµÐí¿ÉÖ¤¡£ÍêÈ«¿ªÔ´µÄ´óÐÍÄ£ÐÍ¡£ÔÚÇáÁ¿¼¶ºÍÖÐÁ¿¼¶¿ªÔ´Ä£ÐÍÖУ¬InternLM2ÔÚ¿¼ÊÔ¡¢ÓïÑÔ¡¢ÖªÊ¶¡¢ÍÆÀí¡¢Êýѧ¡¢´úÂëÁù¸ö·½Ãæ±íÏÖÓÅÔ½¡£ InternLM2µÄ²ÎÊýÁ¿±íÖ»ÓÐ20B£¬ÊôÓÚAGIEval£¨º¬Öйú´óѧÕÐÉú£©¡£ GSM8K£¨ÊýѧÄÜÁ¦ÆÀ¹À£©¡¢MATH£¨ÊýѧÄÜÁ¦ÆÀ¹À£©ÁìÓòÈ¡µÃÁËGPT-3.5µÄ°ÔÖ÷µØÎ»£¬MMLU£¨¶àÈÎÎñÓïÑÔÀí½â¡¢ÖªÊ¶ÆÀ¹ÀºÍÎÊÌâ½â¾ö£¨ÎÊÌâ¼¼ÄÜ£©¡¢BBH£¨ÍÆÀíÊý¾Ý¼¯£© £©¡¢HumanEval£¨OPENAI´´½¨µÄ´úÂëÉú³ÉÄÜÁ¦ÆÀ¹ÀÊý¾Ý¼¯£©ÒѾ­´ïµ½Á˽ӽüGPT-3.5µÄˮƽ¡£Ä¿Ç°ÎÒÃǼÌÐøÎªInternLM2µÄÉÌҵʹÓÃÌṩÃâ·ÑÖ§³Ö£¬µ«Ô¤¼ÆÎ´À´»á½øÒ»²½Ï½µ£¬ÒòΪ¶ÔÓںܶàÖÐСÆóÒµÀ´Ëµ£¬ÕâÊÇÈ˹¤ÖÇÄÜ·¢Õ¹µÄÕ**­¡£¿ªÔ´¡¢´ó¹æÄ£Ä£ÐÍÔ¤¼Æ½«¼ÓËÙÍÆÀí¿¨ÐèÇóµÄÔö³¤¡£¹ú²ú´ó¹æÄ£È˹¤ÖÇÄÜÄ£ÐÍÐèҪǿ´ó¼ÆËãÓ²¼þµÄÖ§³Ö¡£Ô¤ÑµÁ·ÊÇ´óÐÍÄ£ÐÍËãÁ¦ÏûºÄµÄÖ÷Òª½×¶Î¡£¾Þ´óµÄ×ʽðͶÈë´ó´óÌá¸ßÁË×ÔѧÃż÷¡£´ËÍ⣬×ÔÃÀ¹ú³ö¿Ú¹ÜÖÆ¹æ¶¨ÒÔÀ´£¬¹úÄÚ³§É̱»½ûÖ¹²É¹ºNVIDIA¸ß¶ËѵÁ·¿¨£¬¹úÄÚоƬ³§ÉÌÔÚAIѵÁ··½ÃæÓ뺣ÍâÏà±ÈÈÔ´æÔڽϴó²î¾à¡£ÎÒÃÇÏàÐÅ£¬¿ªÔ´´ó¹æÄ£Ä£Ð͵ÄÓÅÔ½ÐÔÄܽ«°ïÖúÏÂÓÎÆóÒµ¿ìËÙѧ**£¬½µµÍ½øÈëAIµÄÃż÷£¬´Ù½øÖÐСÆóÒµÔÚAIÁìÓòµÄ·¢Õ¹£¬¼ÓËÙÈ˹¤ÖÇÄÜÁìÓòµÄ³É³¤¡£ÍÆÀíÐèÇó.¿¨Æ¬¡£

2.2. Sora µÈÄ£ÐͼÓËÙÓ¦Óö˳ÉÊìSora ÊÇÒ»ÖÖ»ùÓÚÀ©É¢µÄTransformer Ä£ÐÍ¡£Æ¾½èÇ¿´óµÄͨÓÃÊÓ¾õÊý¾Ý´¦Àí¹¦ÄÜ£¬Sora ¿ÉÒÔÉú³É¸÷ÖÖ³¤¶È¡¢³¤¿í±ÈºÍ·Ö±æÂʵÄͼÏñÊÓÆµ£¬×¿É´ï60 Ã루1 ·ÖÖÓ£©µÄÁ¬Ðø¸ßÇåÊÓÆµ¡£ Sora ÊÇOpenAI »ùÓÚGPT-4 ºÍDALL-E µÈÓïÑÔºÍͼÏñÄ£Ð͵ĽøÒ»²½Í»ÆÆ£¬´Ó¾²Ì¬µÄ¡¢ÀàËÆÔëÉùµÄÊÓÆµ¿ªÊ¼£¬Öð½¥¶ÔÊÓÆµ½øÐÐÈ¥Ôë´¦Àí¡£´ËÍ⣬¸ÃÄ£ÐÍÄܹ»Éú³É¾ßÓжà¸ö½ÇÉ«¡¢Ìض¨ÀàÐ͵ÄÔ˶¯ÒÔ¼°Ö÷ÌâºÍ±³¾°µÄ¾«È·Ï¸½ÚµÄ¸´ÔÓ³¡¾°£¬ÔÚµ¥¸öÉú³ÉµÄÊÓÆµÖд´½¨¶à¸ö¾µÍ·¡£ÕâÓÐÖúÓÚÈ·±£ÄúµÄ½ÇÉ«ºÍÊÓ¾õ·ç¸ñ׼ȷÇÒÒ»Ö¡£»ùÓÚDALLE 3ºÍGPTÔöÇ¿ÄúµÄÓïÑÔÀí½â¡£ Sora ²ÉÓÃÁ½ÖÖ·½·¨À´ÔöÇ¿ÆäÄ£Ð͵ÄÓïÑÔÀí½âÄÜÁ¦¡£ 1£©»ùÓÚDALLE 3ѵÁ·×ÖĻģÐÍ£¨ÎªÌض¨Í¼Ïñ/ÊÓÆµÉú³É×ÖÄ»£©£¬È»ºóʹÓøÃ×ÖĻģÐÍΪËùÓÐÊÓÆµÉú³É×ÖÄ»¡£ÑµÁ·¼¯£»2£©»ùÓÚGPT½«Óû§Ìáʾת»»Îª¸üÏêϸµÄÃèÊöÐÔ×ÖÄ»²¢·¢Ë͸øSora¡£»ùÓÚÉÏÊöÁ½ÖÖ·½·¨¹¹½¨µÄ´ó¹æÄ£ÊÓÆµÉú³ÉÈ˹¤ÖÇÄÜÄ£ÐÍ¿ÉÒÔÏÔ×ÅÌá¸ßÓ¦ÓóÌÐòµÄÎı¾±£Õæ¶ÈºÍÕûÌåÊÓÆµÖÊÁ¿¡£ Sora Êǽ¨Á¢ÔÚDiT£¨À©É¢±äѹÆ÷£©Ä£ÐÍÖ®Éϵġ£ DiTÄ£ÐÍÊÇÓëTransformerÏà½áºÏµÄÀ©É¢Ä£ÐÍ¡£ DiT=[±äÁ¿×Ô¶¯±àÂëÆ÷£¨VAE£©±àÂëÆ÷+ÊÓ¾õ±ä»»Æ÷£¨ViT£©+È¥ÔëÀ©É¢¸ÅÂÊÄ£ÐÍ£¨DDPM£©+VAE½âÂëÆ÷]¡£¸ù¾ÝWilliam Peebles ºÍSaining Xie ÂÛÎĵÄʵÑé½áÂÛ£¬µ±ÑØ×ÅÄ£ÐÍ´óСºÍÊäÈëtoken ÊýÁ¿Á½¸öÖáÅäÖÃDiT ʱ£¬Gflop ×î¸ßµÄÄ£ÐÍÊÇDiT-XL/2.Masu¡£Ê¹ÓÃ×î´óµÄXL ÅäÖúÍ2 µÄ²¹¶¡´óС¡£Èç¹ûѵÁ·Ê±¼ä×ã¹»³¤£¬DiT-XL/2ÊÇ×îºÃµÄÄ£ÐÍ¡£Ëæ×ÅÏÔ´æ´ø¿íÐèÇóµÄÔö¼Ó£¬ÍÆÀí¼ÆËãÄÜÁ¦Ô¤¼Æ½«Öð½¥ÔöÇ¿¡£ Sora²ÉÓøĽøµÄDiT¼Ü¹¹£¬ÆäËãÁ¦ÏûºÄÓëDiTÀàËÆ¡£ DiT ×ñÑ­ÊÓ¾õ±ä»»Æ÷(ViT) Éè¼ÆÔ­Ôò£¬¿ÉÒÔÌṩ±È´«Í³¾í»ýÍøÂ磨ÀýÈçResNet£©¸ü´óµÄÁé»îÐÔ¡£¸ù¾ÝDiT ¼Ü¹¹ÂÛÎĵÄÔ­×÷ÕßÅжϣ¬Sora ÖеIJÎÊýÊýÁ¿Ô¼Îª30 ÒÚ£¨ÊÇDiT-XL Ä£ÐÍ´óСµÄ3 ±¶£©£¬Õâ½øÒ»²½ÓÐÀûÓÚSora ºóÐøµÄÁé»îµü´ú¡£ÔÚÍÆÀí·½Ãæ£¬Sora »ùÓÚͼÏñÉú³É³¤ÊÓÆµ£¬²¢ÔÚÉú³ÉµÄÊÓÆµÉϽøÐÐÀ©Õ¹£¬Òò´ËÓëʹÓÃÎı¾»òͼÏñÄ£ÐͽøÐÐÍÆÀíÏà±È£¬ËùÐèµÄtoken ÊýÁ¿Ôö¼ÓÁËÒ»¸öÊýÁ¿¼¶¡£¶ÔÍÆÀí¼ÆËãÄÜÁ¦µÄÐèÇ󽫼ÌÐøÔö³¤¡£´ËÍâ£¬Ëæ×Å´ú±ÒÊýÁ¿µÄ²»¶ÏÔö¼ÓÒÔ¼°ÍÆÀí¶Ë¶ÔËãÁ¦µÄÐèÇ󣬶ÔÏÔ´æºÍ´ø¿íµÄÒªÇóÒ²Ô½À´Ô½¸ß£¬400G¹âͨÐż¼ÊõÔÚÒÔÌ«ÍøÖеÄÓ¦ÓÃÔ¤¼Æ½«Ôö¼Ó£¬´ïµ½800GÉõÖÁ1.6 T.Ó¦ÓùâͨÐż¼Êõ¡£ Sora Ô¤¼Æ½«ÔÚ¶à¸öÐÐÒµÇáËÉÉÌÒµ»¯¡£ 360Ê×ϯִÐйÙÖܺèµt±íʾ£¬Sora½«AGIµÄʵʩ´Ó10ÄêËõ¶Ìµ½ÁË1Äê¡£×ÜÌå¶øÑÔ£¬»ùÓÚSoraĿǰµÄÄÜÁ¦£¬¸¨ÒÔÖ§³ÖµÄ1·ÖÖÓÊÓÆµÉú³ÉÒÔ¼°×î¸ß·Ö±æÂÊ2048*2048£¬¿É¹ã·ºÓ¦ÓÃÓÚ¹ã¸æ¡¢ÓÎÏ·¡¢µçÓ°Ô¤¸æÆ¬µÈÁìÓò¡£ÏÖÓвúÆ·£º 1) ÐÂÎÅÒµ£ºSora ÓÐDZÁ¦³¹µ×¸Ä±äÐÂÎű¨µÀ·½Ê½¡£µ±Í»·¢ÐÂÎÅ·¢Éúʱ£¬¼ÇÕßÖ»Ðè±àд¼ò¶ÌµÄ±êÌ⣬ȻºóʹÓÃSoraÄ£Ðͼ´¿ÉÁ¢¼´Éú³ÉÏàÓ¦µÄʵʱÊÓÆµ¡£

ÕâÖÖ´´Ð·½·¨´ó´óÌá¸ßÁËÐÂÎÅÖÆ×÷ºÍ·¢²¼µÄЧÂÊ£¬Ê¹ÐÂÎű¨µÀ¸ü¿ì¡¢¸ü¼°Ê±£»2£©¹ã¸æÐÐÒµ£ºÆóҵʹÓÃSoraÀ´¸Ä½ø²úÆ·¹¦ÄÜ£¬²¢¸ù¾ÝÄúµÄÆ·ÅÆ¹ÊÊ£¬¿ÉÒÔÔں̵ܶÄʱ¼äÄÚ¿ìËÙÉú³É¶à¸ö°æ±¾ÆÚÏÞ´ÙÏú¡£ÊÓÆµ¡£ÕâÖÖ´´Ð·½Ê½²»½öÌá¸ßÁËÓªÏúЧÂÊ£¬»¹´ó·ù½µµÍÁËÖÆ×÷³É±¾£»3£©XR£ºAIÊÓÆµÉú³ÉSora×÷Ϊ´óÐÍÄ£ÐÍ£¬¿ÉÒÔÉú³É±ÆÕæµÄ3DÄ£ÐͺͶ¯»­£¬ÎªÓû§Ìṩ·á¸»¡¢ÓÅÖʵÄXRÓ¦ÓÃÄÚÈÝ×ÊÔ´Âú×ãÄúµÄÐèÇó¡£ÐéÄâÊÀ½çµÄ¸ß±ê×¼¡£´ËÍ⣬SoraÖ§³ÖʵʱäÖȾ£¬ÔÊÐíÓû§ÓëÐéÄâ»·¾³ÊµÊ±½»»¥£¬Ôö¼Ó³Á½þ¸Ð£¬Ìá¸ßÓû§²ÎÓë¶È£¬ÎªXRÓ¦ÓôøÀ´¸ü×ÔÈ»µÄ½»»¥ÌåÑé¡£ÎÒÃÇÈÏΪSoraµ±Ç°½×¶Î¶ÔÓ¦µÄÊÇGPT-3½×¶Î£¬ÕâÊÇÒ»¸ö²»ÍêÕûµÄÄ£ÐÍ£¬µ«»ùÓÚGPT-3µ½GPT-4µÄ¿çÔ½£¬SoraµÄ¹¦Äܽ«¼ÌÐø½øÒ»²½ÍêÉÆ£¬Ëæ×ŽøÒ»²½µÄµü´ú¸¨ÖúGPTºÍDALL¡¤EϵÁУ¬SoraÓÐÍûÔÚB¶Ë¿ìËÙÉÌÓ㬴ø¶¯ÍÆÀí¶ËÐèÇóÔö³¤¡£ 2.3. ASIC¼Ü¹¹ÔÚÍÆÀí¶Ë¿ÉÄÜÓÐÓÅÊÆ¹úÄÚ³§ÉÌÕýÔÚ×·¸Ï¸ü¿ìµÄASIC¼Ü¹¹£¬ÔÚÍÆÀí¶Ë¿ÉÄÜÓÐÓÅÊÆASIC£¨×¨Óü¯³Éµç·£©ÊÇΪÂú×ãÌØ¶¨ÓÃ;¶øÉè¼ÆµÄ£¬¶¨ÖƵļ¯³Éµç·£¬Ö»ÓйؼüµÄµØ·½ÓëÌØ¶¨ÓÃ;ÃÜÇÐÏà¹ØµÄµ¥Ôª±£ÁôÔڼܹ¹ÖУ¬²¢ÇÒ¸ü´ó±ÈÀýµÄоƬ¿Õ¼äÓÃÓÚÖ§³ÖÌØ¶¨ÓÃ;¼ÆËã¡£ÓëGPGPUÏà±È£¬ASIC¾ßÓиßÐÔÄÜ¡¢µÍ¹¦ºÄ¡¢Ð¡Ìå»ýµÈÌØµã£¬¶ÔÓڹ̶¨ÓÃÍ¾ÍÆÀí¶ËµÄÐèÇó¾ßÓÐÃ÷ÏÔµÄÓÅÊÆ¡£ÓëGPU Ïà±È£¬ASIC ¹¦ºÄ¸üµÍ¡£ ASIC Õë¶ÔÓÃ;½øÐÐÁËÓÅ»¯£¬¾ßÓÐʱÖÓÃſء¢¶¯Ì¬µçѹºÍ¶¯Ì¬ÆµÂʵÈÉè¼Æ£¬ÓëGPGPU µÈ¸üͨÓõļܹ¹Ïà±È£¬¹¦ºÄ¸üµÍ£¬Í¬Ê±ASIC ¼õÉÙÁËÈßÓ൥Ԫ£¬ÏÔ׎µµÍÁ˹¦ºÄ¡£ÎªÁ˼õÉÙÐ¾Æ¬Ãæ»ýºÍÖØÁ¿£¬Meta µÄ¼¼Êõ¸ºÔðÈËOlivia Wu ±íʾ£ºÓÐÖúÓÚ½µµÍоƬ¹¦ºÄºÍ³É±¾¡£ ¡· 1£©Ê±ÖÓÃÅ¿ØÉè¼Æ£º¿ÉÒԹرյç·ÖÐδʹÓò¿·ÖµÄÐźţ¬ÏÔ׎µµÍ¹¦ºÄ£»2£©¶¯Ì¬µçѹÉè¼Æ£ºµ±µç·ûÓÐÒÔ×î´óÈÝÁ¿ÔËÐÐʱ£¬½µµÍµç·µçѹÒÔ½ÚÊ¡¹¦ºÄ£»3£©¶¯Ì¬ÆµÂÊÉè¼Æ£ºÔÚASIC¿ÕÏлòÇáÔØÊ±½µµÍƵÂÊ¿ÉÒÔÏÔ׎µµÍ¹¦ºÄ¡£µ±ASIC ´¦ÓÚÖØ¸ºÔØÊ±£¬Ôö¼ÓƵÂÊ¿ÉÒÔÌá¸ßÐÔÄÜ¡£ ASIC ÔÚʵ֤Ñо¿ÖбíÏÖÁ¼ºÃ¡£ÂÛÎÄ¡¶2023 Öйú°ëµ¼ÌåͶ×ÊÉî¶È·ÖÎöÓëÕ¹Íû¡· ÖеÄÑо¿±íÃ÷£¬ASIC ±ÈGPU ºÍFPGA ¾ßÓиüºÃµÄÐÔÄܺ͸üµÍµÄ¹¦ºÄ¡£ÒÔ×îÁ÷ÐеÄASIC ¼Ü¹¹Ö®Ò»µÄTPU ΪÀý£¬AlphaGo µÄÔçÆÚ°æ±¾ÔËÐÐÔÚCPU ºÍGPU ¼¯ÈºÉÏ£¨2015 Äê10 Ôµķֲ¼Ê½°æ±¾ÓÐ1202 ¸öCPU ºÍ176 ¸öGPU£©£¬ºóÀ´µÄ°æ±¾Ê¹ÓÃÁËTPU¡£È¡µÃÁ˽Ϻõijɼ¨¡£´ó¹æÄ£Ä£ÐͲÎÊý²»¶ÏÊÕÁ²£¬ASICÓ­À´·¢Õ¹»úÓö¡£¾¡¹ÜASICÔÚÀíÂÛÉϺÍʵ¼Ê²âÁ¿Öж¼¾ßÓÐÓÅÒìµÄÐÔÄÜ£¬µ«ÆäͨÓÃÐԵ͡¢Éè¼ÆÖÜÆÚ³¤µÈÌØµãʹÆäÔÚÈ˹¤ÖÇÄÜÔçÆÚ´óÁ¿²ÎÊýµÄ´óÐÍÄ£ÐÍ¿ìËÙµü´úµÄÔçÆÚ½×¶ÎÄÑÒÔÔÚʵ¼ÊÓ¦ÓÃÖÐʵÏÖ¡£°Ù·Ö±È½«»á¸üµÍ¡£Ëæ×Å´ó¹æÄ£Ä£Ð͵ÄÖð²½·¢Õ¹£¬²ÎÊýÁ¿µÄÔö¼ÓÔ¤¼Æ»áÖð½¥ÊÕÁ²£¬±ÈÈçSuper Fusion CTO¶¡Óî¾Í±íʾ£¬´ó¹æÄ£Ä£Ð͵ÄÊÕÁ²ÊDZØÈ»Ç÷ÊÆ£¬ÎÒ¾ÍÊÇ¡£µ±´ó¹æÄ£Ä£ÐÍÊÕÁ²Ê±£¬²ÎÊýÇ÷ÓÚÎȶ¨£¬Ä£Ð͵ÄÐÔÄÜÔÚѵÁ·Êý¾ÝºÍÑéÖ¤Êý¾ÝÉÏÒ²´ïµ½Ïà¶ÔÎȶ¨µÄ״̬£¬Òò´Ë¿ª·¢·¢»Ó¸ßÐÔÄÜ¡¢µÍ¹¦ºÄµÈÓÅÊÆµÄASIC·Ç³£ÖØÒª¡£µçÁ¦ÏûºÄ£¬»úÓö¿ÉÆÚ¡£ÏûºÄ¡£ ASIC ÓÐÍû³ÉÎªÍÆÀí¶ËоƬµÄÖ÷µ¼¼Ü¹¹¡£ÀíÂÛÉÏÀ´Ëµ£¬ASICÊÇÒ»ÖÖ¶¨ÖÆÐ¾Æ¬£¬ÔÚ´¦ÀíÍÆÀí¶ËµÄÌØ¶¨ÐèÇó·½Ãæ¾ßÓжÀÌØµÄÓÅÊÆ¡£

´ÓÓ¦Óó¡¾°À´¿´£¬Ëæ×Ÿü´óµÄÄ£ÐÍÊÕÁ²£¬Ä£Ð͵ü´úËٶȼõÂý£¬Ôö¼ÓÁËASICÓ¦ÓõĿÉÐÐÐÔ¡£Âó¿ÏÎý¹«Ë¾¼ÆËãµÃ³ö£¬ASIC ÊÇÂú×ãÍÆÀí¶ËÐèÇóµÄÐí¶àÁìÓòµÄÊ×ѡоƬ¼Ü¹¹£¬°üÀ¨ÓïÑÔÀí½â¡¢Ã沿ʶ±ð¡¢¶¯Ì¬¶¨¼ÛºÍ×Ô¶¯¼ÝÊ»¡£Ëæ×Å´ó¹æÄ£Ä£Ð͵ijÉÊìÒÔ¼°ÏÂÓÎÍÆÀí¶ËÐèÇóµÄ±¬·¢£¬ASICÊг¡·Ý¶î½«¿ìËÙÔö³¤¡£

2.4¡¢º£Íâ¸÷´ó³§É̼ÓËÙASICоƬ²¼¾Ö¹È¸è£ºTPUÊǹȸè×ÔÑеÄAI¼ÓËÙоƬ£¬ÆäAIÄ£ÐÍgemini²ÉÓÃTPUÖ§³ÅËãÁ¦¡£¹È¸è´Ó2006Äê¾Í¿ªÊ¼¿¼ÂÇASIC²¼¾Ö£¬²¢ÔÚ2016Äê¹È¸èI/O¿ª·¢Õß´ó»áÉÏÕýʽÐû²¼ÄÚ²¿³É¹¦¿ª·¢³öTPU£¬ÎÒÀ´ÁË¡£ TPU v4 ±ÈNvidia A100 ¸üºÃ£¬µ«ÔÚH100 ÉÏÉԲ TPU-v5p оƬ¿ÉÌṩ197TFLOPS (BF16) µÄ·åÖµ¼ÆËãÄÜÁ¦ºÍ820GB/s µÄ´ø¿í£¬ÓëÉÏÒ»´úÏà±È£¬ÑµÁ·ÐÔÄÜÌá¸ß2 ±¶£¬ÍÆÀíÐÔÄÜÌá¸ß2.5 ±¶¡£ TPUϵÁвÉÓÃ128*128 MXUÄ£¿é£¬¸ü¸ßЧµØÔËÐÐоƬ¡£ TPU-v1ÊÇרÓÃÓÚÍÆÀíµÄоƬ£¬TPU-v2ºÍTPU-v3ÊÇÍÆÀíºÍѵÁ·Á½ÓÃоƬ£¬»ùÓÚVolta¼Ü¹¹£¨

GPGPU£©Ïà±È£¬TPU-v3 ÔÚÐÔÄܱíÏÖ½Ó½üµÄÇé¿öÏÂʵÏÖÁ˸ü СµÄÐ¾Æ¬Ãæ»ý¡£ÔÚ MXU Ä£¿é£¬TPU-v2 ºÍ TPU-v3 °Ñ TPU-v1 µÄµ¥¸ö 256*256 MXU ÐÞ¸ÄΪ 4 ¸ö 128*128 MXU ¾í»ýÄ£ÐÍ£¬°ÑÀûÓÃÂÊ´Ó 22%- 30%ÌáÉýÖÁ 37%-48%£¬´øÀ´¸ü¸ßµÄÔËÐÐЧÂÊ£¬Èç¹û½øÒ»²½Ñ¹ËõΪ 16 ¸ö 64*64 Ä£¿é£¬ÀûÓÃÂÊԼΪ 38%-52%£¬ÌáÉý½ÏС£¬µ«ÓÉËùÐè¿ØÖÆÄ£¿é µÈ´øÀ´µÄÃæ»ý»á´ó·ùÔö¼Ó£¬Òò´Ë 128*128 ÊDZȽÏÀíÏëµÄ MXU Ä£¿éÀà ÐÍ¡£ºóÐøµÄ TPU-v4 ¸üÊÇ»ùÓÚ´ËÔÚÃæ»ýδ´ó·ùÌáÉýµÄÇé¿öÏ£¬ÒÔ¸üµÍµÄ ¹¦ºÄ£¨300W£©ÊµÏÖÁ˳¬ TPU-v3 2 ±¶µÄËãÁ¦£¨275TFLOPS£©¡£TPU-v5e ºÍ TPU-v5p ·Ö±ðÊÇ TPU ϵÁÐÖÐ×î¾ß³É±¾Ð§ÒæºÍ×îÇ¿´óµÄ²ú Æ·£¬´¦ÓÚÒµÄÚÁìÏȵØÎ»¡£TPU v5e Pod ƽºâÁËÐÔÄÜ¡¢Áé»îÐÔºÍЧÂÊ£¬ ÔÊÐí¶à´ï 256 ¸öоƬ»¥Á¬£¬Í¨ÓÃÐÔ·½ÃæÖ§³Ö°ËÖÖ²»Í¬ÐéÄâ»úÅäÖã¬¿É ÒÔÓɿͻ§×ÔÐÐÑ¡ÔñÒÔ·þÎñÓÚ¸÷ÖÖÄ£ÐÍ¡£TPU-v5p Ö÷ÒªÌáÉý·½ÏòΪÐÔ ÄÜ£¬Áé»îÐԺ͹æÄ££¬Í¨¹ý×î¸ß´ø¿íµÄоƬ¼ä»¥Áª£¨ICI£©£¬ÒÔ 4800 Gbps/chip ÔÚ 3D Ô²»·ÍØÆËÖн« 8960 ¸öоƬ×éºÏÔÚÒ»Æð¡£¸ù¾Ý¹È¸è¹Ù ·½Êý¾Ý£¬½èÖúµÚ¶þ´ú SparseCore£¬BF16 Ï TPU-v5p µÄѵÁ·Ð§ÂÊ´ï TPU-v4 µÄ 1.9 ±¶£¬Èç²ÉÓà INT8 ½øÐÐѵÁ·ÔòѵÁ·Ð§ÂÊ´ï 2.8 ±¶¡£Ó¢Ìضû£ºGaudi2 ´ó·ùÁìÏÈ A100£¬ÉÔÈõÓÚ H100¡£Ó¢ÌضûÊÇÈ«ÇòÁìÏÈµÄ Ð¾Æ¬ÖÆÔìÉÌ£¬ÓÚ 2020 Äê 1 ÔÂÊÕ¹º habana ÓÃÓÚÉú²ú ASIC оƬ Gaudi ϵÁУ¬Ä¿Ç°ÒÑÍÆ³ö Gaudi¡¢Gaudi2 ºÍÖйú¶¨ÖưæÐ¾Æ¬ Gaudi2C£¬ÆäÖÐ Gaudi2C ³öÓÚ¹æ±Ü½ûÁîµÄÄ¿µÄ¶ÔËãÁ¦½øÐÐÁË´ó·ùϵ÷¡£¸ù¾Ý¹«Ë¾¹ÙÍø µÄÊý¾Ý£¬Ïà±ÈÓÚ A100£¬2022 ÄêÍÆ³öµÄ Gaudi2 Äܹ»ÔÚ BF16/FP32 ¾« ¶ÈÏÂʵÏÖѵÁ·¶Ë 1.70-2.44 ±¶±íÏÖ£¬ÔÚÍÆÀí¶Ë 1.42-2.89 ±¶±íÏÖ£¬¿¼ÂÇ µ½ H100 ÊÇ A100 ÍÆÀí/ѵÁ·±íÏÖµÄ 3.5/2.3 ±¶£¬Ô¤¼Æ Gaudi2 ÕûÌåÐÔÄÜ ÈõÓÚ H100¡£Gaudi2 ÔÚµÚÒ»´ú Gaudi »ù´¡ÉϽøÐÐÁËÉý¼¶£¬ÖúÁ¦¿Í»§½µ±¾ÔöЧ¡£ Gaudi2 ½¨Á¢ÔÚµÚÒ»´ú Gaudi ÉÏ£¬ÖƳ̹¤ÒÕ´Ó 16nm Éý¼¶Îª 7nm£¬Ôö¼Ó ÁË FP8 ¾«¶ÈÖ§³Ö£¬²ÉÓà HBM2e 96GB ÄÚ´æºÍ 2.45TB/s ´ø¿í¡£ÔÚ Gaudi2 Éϼ̳ÐÁË 24 ¸ö RoCE2 ¶Ë¿Ú£¨µÚÒ»´ú Gaudi Ϊ 10 ¸ö£©£¬²ÉÓà °Ë¿¨»¥Áª¼Ü¹¹´î½¨£¬Í¬Ê±ÌṩÏàÓ¦»ù°å¡£Í¨¹ýƬÉÏ RoCE ¼¯³É£¬¿Í»§ ¿ÉÒÔÇáËÉÀ©Õ¹ÅäÖà Gaudi2 ϵͳÒÔÂú×ãÉî¶Èѧ**ÒªÇó£¬Í¬Ê±ÓÉÓÚ¿ÉÒÔͨ ¹ýÒÔÌ«ÍøÊµÏÖ Gaudi Ö®¼äµÄͨÐÅ£¬Äܹ»Îª¿Í»§ÊµÏÖ¶îÍâµÄ³É±¾½ÚÔ¼¡£ÑÇÂíÑ·£º×ÔÑÐ ASIC оƬ£¬Trainium2 ÐÔÄÜÓÐÍûʵÏÖÐÂÍ»ÆÆ¡£ÑÇÂíÑ·×Ô ÑÐ ASIC оƬ°üÀ¨ Inferential ºÍ Trainium Á½¸öϵÁУ¬·Ö±ðÓÃÓÚÍÆÀíºÍ ѵÁ·¡£Ä¿Ç°ÍÆÀíоƬµü´úÖÁ Inferential2£¬·åÖµËãÁ¦´ï 380TOPS £¨INT8£©£¬½ÏÉÏÒ»´úоƬÌáÉý 5 ±¶£»ÑµÁ·Ð¾Æ¬µü´úÖÁ NeuroCore-v2¡£ASIC δÀ´·Ý¶îÓÐÍû¿ìËÙÌáÉý¡£Ïà½ÏÓÚ GPU£¬ASIC ´¦ÀíËٶȸü¿ì£¬µ«¶¨ ÖÆ»¯³Ì¶È¸ß£¬³É±¾½Ï´ó¡£ÔÚ AI ·¢Õ¹³õÆÚ£¬¸÷´ó»¥ÁªÍø¾ÞÍ··×·××ÔÑдóÄ£ ÐÍ£¬ÒòӢΰ´ï GPU+CUDA ͨÓÃÐԽϸߣ¬ÏÂÓδ󶼲ÉÓÃÆä²úÆ·½øÐÐÓ²¼þ ´î½¨¡£´ËÍâ³õÆÚ¸÷¼ÒÄ£ÐͲÎÊý¼°Ëã·¨²»¶ÏÓÅ»¯Éý¼¶£¬ÕûÌåµü´úËٶȿ죬 ²»ÊʺϲÉÓö¨ÖÆ»¯³É±¾½Ï¸ßµÄ ASIC ·½°¸¡£µ«Î´À´°éËæÄ£Ð͵ü´ú·Å»º£¬ ²ÎÊýÁ¿ÊÕÁ²£¬Ëã·¨¸´ÔÓÐÔÒªÇóÌá¸ß£¬ASIC Õë¶ÔÌØ¶¨ÐèÇ󿪷¢µÄ¶¨ÖÆ»¯ÓÅ ÊÆÓÐÍûÏÔÏÖ£¬Ò²ÓÐÀûÓÚÓ븴ÔÓËã·¨ÓиüǿƥÅ䣬·Ý¶îÓÐÍû¿ìËÙÔö³¤¡£¹ú²ú AI оƬ³§ÉÌÓÐÍûÔÚÍÆÀíÁìÓò¼ÓËÙ×·¸Ï¡£Ïà½ÏÓÚѵÁ·Ð¾Æ¬£¬ÍÆÀíоƬ ¶ÔÉú̬¼°¶à¿¨»¥ÁªÒªÇó½ÏС£¬Ä¿Ç°¹ú²ú³§Ḛ́üÀ¨»ªÎª•NÌÚ¡¢º®Îä¼Í¡¢ìÝ Ô­¿Æ¼¼µÈ³§É̲úÆ·¾ù»ùÓÚ ASIC ¼Ü¹¹£¬È«Çò ASIC Êг¡²¢Î´ÐγÉÃ÷ÏÔµÄ Í·²¿³§ÉÌ£¬¹ú²ú¹«Ë¾ºóÐøÓÐÍûÖð²½×·¸Ï¡£ Èý¡¢¹ú²úËãÁ¦£ºAI ʱ´ú³Ë·çÆð3.1¡¢»ªÎª•NÌÚ£º¹ú²úËãÁ¦Áì¾üÕß»ªÎª•NÌÚ£¨HUAWEI Ascend£©ÏµÁÐоƬÊÇ»ùÓÚ»ªÎª×ÔÖ÷Ñз¢µÄ´ï·ÒÆæ ¼Ü¹¹Éè¼ÆµÄ AI оƬ£¬°üÀ¨ÑµÁ·ºÍÍÆÀíоƬ£¬Æä²ÎÊý¼°±íÏÖÔÚ¹úÄÚ´¦ÓÚÁì ÏÈˮƽ£¬²¢ÑÜÉú³ö¶ÀÌØµÄ•NÌÚ¼ÆËã²úÒµ¡£•NÌÚϵÁÐоƬÖ÷ÒªÓÉ»ªÎªÈ«×Ê ×Ó¹«Ë¾ÉîÛÚÊк£Ë¼°ëµ¼ÌåÓÐÏÞ¹«Ë¾Ñз¢£¬¸Ã×Ó¹«Ë¾³ÉÁ¢ÓÚ 2004 Ä꣬³ý •NÌÚÍ⻹ӵÓÐ÷è÷ë¡¢°ÍÁú¡¢öïÅôµÈ×ÔÑÐоƬϵÁУ¬Ñз¢ÊµÁ¦Ç¿´ó¡£¡°ÈíÓ²¼þ+È«Éú̬¡±´òÔìÃæÏò¡°¶Ë¡¢±ß¡¢ÔÆ¡±µÄÈ«³¡¾° AI »ù´¡ÉèÊ©¡£•NÌÚ¼Æ Ëã²úÒµÊÇ»ùÓÚ•NÌÚϵÁд¦ÀíÆ÷ºÍ»ù´¡Èí¼þ¹¹½¨µÄȫջ AI ¼ÆËã»ù´¡ÉèÊ©¡¢ ÐÐÒµÓ¦Óü°·þÎñ£¬°üÀ¨•NÌÚϵÁд¦ÀíÆ÷¡¢ÏµÁÐÓ²¼þ¡¢CANN£¨ComputeArchitecture for Neural Networks£¬Òì¹¹¼ÆËã¼Ü¹¹£©¡¢AI ¼ÆËã¿ò¼Ü¡¢Ó¦Óà ʹÄÜ¡¢¿ª·¢¹¤¾ßÁ´¡¢¹ÜÀíÔËά¹¤¾ß¡¢ÐÐÒµÓ¦Óü°·þÎñµÈÈ«²úÒµÁ´¡£ÆäÖУ¬ ÒÔоƬΪÖ÷µÄȫӲ¼þÌåϵÊÇʵÏÖ AI ÑµÍÆµÄµ×²ãÖ§³Å£¬ÒÔ×ÔÑмÆËã¼Ü¹¹Îª Ö÷µÄÈí¼þÌåϵÊÇÎüÒý¿ª·¢ÕߵĻîÁ¦Ö®Ô´£¬ÒÔÓ¦ÓÃÈí¼þΪÖ÷µÄ²úÒµÉú̬ÊÇ ÃæÏòδÀ´·¢Õ¹µÄ²»½ß¶¯Á¦¡£•NÌÚÓ²¼þÌåϵÊÇʵÏÖ AI ÑµÍÆµÄËãÁ¦»ù´¡ºÍµ×²ãÖ§³Å¡£•NÌÚ¼á³Ö¡°Ó²¼þ¿ª ·Å¡±²ßÂÔ£¬Îª¿Í»§Ìṩ×ÔÓÐÓ²¼þºÍ»ï°éÓ²¼þµÄ¶àÑù»¯ËãÁ¦Ñ¡Ôñ¡£ 1£©×ÔÓÐÓ²¼þΪ•NÌÚϵÁд¦ÀíÆ÷ÒÔ¼°»ùÓÚ•NÌÚ´¦ÀíÆ÷ºÍÒµ½çÖ÷Á÷Òì¹¹¼Æ Ë㲿¼þµÄ•NÌÚ Atlas ϵÁÐÓ²¼þ²úÆ·¡£•NÌÚϵÁд¦ÀíÆ÷Ö÷Òª°üÀ¨•NÌÚ 310¡¢ •NÌÚ 910¡¢•NÌÚ 910B µÈ£¬•NÌÚ Atlas ϵÁÐÓ²¼þ²úÆ·°üÀ¨¸÷ÀàÄ£×é°å¿¨¡¢ Сվ¡¢·þÎñÆ÷¡¢¼¯ÈºµÈ·á¸»µÄ²úÆ·ÐÎ̬¡£•NÌÚ×ÔÓÐÓ²¼þÌåϵּÔÚ´òÔìÃæ Ïò¡°ÔÆ¡¢±ß¡¢¶Ë¡±µÄÈ«³¡¾° AI »ù´¡ÉèÊ©·½°¸£¬¿É¹ã·ºÓÃÓÚ¡°Æ½°²³ÇÊÐÖÇÄܽ» ͨ¡¢ÖÇÄÜÒ½ÁÆ¡¢ÖÇÄÜÁãÊÛ¡¢ÖÇÄܽðÈÚ¡±µÈÁìÓò¡£ 2£©»ï°éÓ²¼þÖ¸»ªÎª¿ª·Å×ÔÓÐÓ²¼þ£¬ºÏ×÷»ï°é¿É½øÐм¯³ÉºÍ¶þ´Î¿ª·¢£¬»ò Õßͨ¹ý OEM/ODM ·½Ê½¿ª·¢×ÔÓÐÆ·ÅƵķþÎñÆ÷Õû»ú¡£•NÌÚϵÁд¦ÀíÆ÷ÊÇÓ²¼þÌåϵµÄºËÐÄ¡£•NÌÚ´¦ÀíÆ÷רΪ AI ¼ÆËãÉè¼Æ£¬ÓµÓÐ ×ÔÑдï·ÒÆæ¼Ü¹¹µÄ£¬Äܹ»¸²¸Ç¶Ë±ßÔÆÈ«³¡¾°£¬Âú×㲻ͬ²¿Êð»·¾³²îÒìÐÔ µÄËãÁ¦ÐèÇó¡£»ªÎªÓÚ 2018 Äê 10 ÔµĻªÎªÈ«Áª½Ó´ó»áÉÏÊ״βûÊöÁË»ªÎª AI Õ½ÂÔ£¬²¢¹«²¼ÁË•NÌÚ 910 ºÍ•NÌÚ 310 Á½¿î AI оƬ£¬ÆäÖЕNÌÚ 310 ÊÇ Ò»¿î×î´ó¹¦ºÄ½ö 8W µÄ¼«Ö¸ßЧ¼ÆËãµÍ¹¦ºÄ AIоƬ£¬2018 ÄêÉÌÓÃÁ¿²ú£¬ ¿ÉÓÃÓÚÍÆÀí¶Ë£»•NÌÚ 910 ÔÚ 2019 Äê 8 ÔÂÕýʽÉÌÓã¬ÓÃÓÚѵÁ·¶Ë¡£•NÌÚ 910 Ê״βÉÓôï·ÒÆæ¼Ü¹¹£¬»ùÓÚ 7nm ÔöÇ¿°æ EUV ¹¤ÒÕ£¬¼¯³É 32 ¸öÁ¢·½ Ì弯ËãÒýÇæ£¬°ë¾«¶È£¨FP16£©ËãÁ¦´ï 320 TFLOPs£¬Ïà±ÈӢΰ´ïµ±Ê±µÄ V100 SXM µÄ 125 TFLOPS ¸ßÒ»±¶ÒÔÉÏ¡£2023 Äê 9 Ô£¬»ªÎªÔÚÊÜÃÀ¹ú ÖÆ²ÃÈýÄêºó·¢²¼•NÌÚ 910B£¬ÆäÐÔÄÜÈ¡µÃÖØ´óÍ»ÆÆ£¬µ¥¾«¶ÈËãÁ¦´ó·ùÌá Éý£¬±íÃ÷»ªÎª³öÉ«µÄоƬ×ÔÑÐÄÜÁ¦Óë•NÌÚ AI ´¦ÀíÆ÷δÀ´¼«¸ßµÄÔö³¤¿Õ ¼ä¡£×ÔÑдï·ÒÆæ¼Ü¹¹´ó·ùÌáÉý AI ËãÁ¦¡£•NÌÚϵÁÐ AI ´¦ÀíÆ÷´´ÐÂʹÓôï·ÒÆæ ¼Ü¹¹£¬ÊÇ»ªÎª×ÔÑеÄÃæÏò AI ¼ÆËãÌØÕ÷µÄȫмÆËã¼Ü¹¹£¬¾ß±¸¸ßËãÁ¦¡¢¸ß ÄÜЧ¡¢Áé»î¿É²Ã¼ôµÄÌØÐÔ¡£»ùÓÚ´ï·ÒÆæ¼Ü¹¹µÄ AI ºËÄÚº¬ 3D Cube¡¢Vector ÏòÁ¿¼ÆËãµ¥Ôª¡¢Scalar ±êÁ¿¼ÆËãµ¥ÔªµÈ£¬¹²Í¬±£ÕÏ AI ¼ÆËãµÄ¸ßЧ´¦Àí¡£ ÔÚÉñ¾­ÍøÂçÄ£ÐÍÖÐ 99%µÄ¼ÆËã¶¼ÐèÒªÓõ½¾ØÕó³Ë·¨ÔËË㣬Õⲿ·ÖÔËËãÊÇ AI ¼ÆËãµÄºËÐÄ£¬ÔÚ´ï·ÒÆæ¼Ü¹¹ÖÐÓÉ 3D Cube À´Íê¡£3D Cube Äܹ»ÔÚÒ» ¸öʱÖÓÖÜÆÚÄÚÍê³É 4096 ´Î³Ë¼ÓÔËË㣬Ïà±È´«Í³ 2D ½á¹¹ÔËËãÖÜÆÚ¶Ì¡¢Ê± Ñӵ͡¢ÀûÓÃÂʸߡ£´ËÍ⣬AI ºËÖÐµÄ Buffer L0A¡¢L0B¡¢L0C ÓÃÓÚÏò 3D Cube ÊäËÍÊý¾ÝºÍ´æ·Å¼ÆËã½á¹û¡£¸ßËÙ»¥Áª·½Ã棺•NÌÚ´¦ÀíÆ÷»¹ÓµÓÐ×ÔÑÐ HCCS ½Ó¿Ú£¬¿ÉÒÔÍê³É•NÌÚ´¦Àí Æ÷Ö®¼äµÄ»¥Áª£¬×îÐÂÒ»´ú•NÌÚ 910B µÄ HCCS »¥ÁªËٶȿɴï 392 GB/s£¬ ½áºÏ PCle 5.0 ºÍ RoCE ½Ó¿Ú¿ÉÒÔ×齨¸ü¾ß¹æÄ£µÄѵÁ·ÏµÍ³£¬È«ÃæÊÍ·Å Ó²¼þËãÁ¦¡£AI ¼¯ÈºÊÇ´óÄ£ÐÍѵÁ·µÄ×îÖÕÓ²¼þ²úÆ·ÐÎ̬£¬•NÌÚ AI ¼¯Èº¿ÉÖ§³ÖÍò¿¨¹æ Ä£¡£»ªÎª»ùÓÚ•NÌÚϵÁд¦ÀíÆ÷¿ª·¢ÓÐһϵÁЕNÌÚ Atlas Ó²¼þ²úÆ·£¬°üÀ¨ Ä£¿é¡¢°å¿¨¡¢ÖÇÄܱßÔµ¡¢·þÎñÆ÷¡¢¼¯ÈºµÈ£¬¿É¹ã·ºÓ¦ÓÃÓÚ½ÌÓý¿ÆÑС¢ÖÇ »Û³ÇÊС¢Öǻ۽»Í¨µÈ¸÷ÖÖËãÁ¦ÐèÇóˮƽµÄÁìÓò¡£ÔÚ´óÄ£ÐÍѵÁ·ÖÐÓÉÓÚµ¥ ¿¨ËãÁ¦ÓÐÏÞ£¬Í¨³£»á»ùÓڶ࿨»¥ÁªÐγÉǧ¿¨ÄËÖÁÍò¿¨¹æÄ£µÄ¼¯Èº£¬»ªÎª Äܹ»Ìṩ»ò×é×°°üÀ¨¼¯ÈºÔÚÄÚµÄȫϵӲ¼þ²úÆ·¡£2023 Äê 7 Ô»ªÎªÐû²¼ •NÌÚ AI ¼¯Èº¹æÄ£´Ó×î³õµÄ 4000 ¿¨¼¯ÈºÀ©Õ¹ÖÁ 16000 ¿¨£¬³ÉΪҵ½çÊ׸ö Íò¿¨ AI ¼¯Èº£¬ÓµÓиü¿ìµÄѵÁ·ËÙ¶ÈºÍ 30 ÌìÒÔÉϵÄÎȶ¨ÑµÁ·ÖÜÆÚ£¬Ê®±¶ ÁìÏÈÒµ½ç¡£ÍƳöÒì¹¹¼ÆËã¼Ü¹¹ CANN£¬¹¹ÖþÉú̬»¤³ÇºÓ¡£CANN£¨Compute Architecture for Neural Networks£©ÊÇ»ªÎªÕë¶Ô AI ³¡¾°ÍƳöµÄÒì¹¹¼ÆË㠼ܹ¹£¬¶ÔÉÏÖ§³Ö PyTorch¡¢MindSpore¡¢TensorFlow µÈ¶àÖÖ AI ¿ò¼Ü£¬¶Ô Ï·þÎñ AI ´¦ÀíÆ÷Óë±à³Ì£¬·¢»Ó³ÐÉÏÆôϵĹؼü×÷Óã¬ÊÇÌáÉý•NÌÚ AI ´¦ ÀíÆ÷¼ÆËãЧÂʵĹؼüƽ̨¡£ CANN ÌáÁ¶³öÈý²ãÂß¼­¼Ü¹¹¡ª¡ªÓ¦Óò㡢оƬʹÄܲ㡢¼ÆËã×ÊÔ´²ã£¬Ó¦ ÓòãÌṩ¸øÓû§¸÷ÖÖËã·¨¿ª·¢¡¢µ÷ÓŹ¤¾ß£¬Ð¾Æ¬Ê¹ÄܲãÌṩÐÔÄÜÌáÉý½â ¾ö·½°¸£¬¼ÆËã×ÊÔ´²ãÌṩÊý¾Ý´¦Àí¼°ÔËËãÖ´ÐÐÉ豸µÈ¡£Èý²ãÂß¼­¼Ü¹¹Õ¹ ÏÖÁËÆä¼«¼ò¿ª·¢¡¢¼«ÖÂÐÔÄÜ¡¢¿ª·ÅÉú̬µÄÌØµã£¬ÕâÐ©ÌØµã¶Ô•NÌÚоƬ¶á È¡ÊÐÕ¼ÂʾßÓÐÕ½ÂÔÐÔÒâÒ壺 1£©¼«¼ò¿ª·¢£ºCANN Õë¶ÔËã×Ó¿ª·¢³¡¾°ÍƳö Ascend C£¬Ô­ÉúÖ§³Ö C ºÍ C++±ê×¼¹æ·¶£¬×î´ó»¯Æ¥ÅäÓû§¿ª·¢**¹ß£»Í¨¹ý¶à²ã½Ó¿Ú³éÏó¡¢×Ô¶¯²¢ÐмÆËã¡¢ÂÏÉúµ÷ÊԵȹؼü¼¼Êõ£¬ÖúÁ¦ AI ¿ª·¢Õß½µ±¾ÔöЧ¡£ 2£©¼«ÖÂÐÔÄÜ£ºÍ¨¹ý×ÊÔ´Áé»îµ÷¶È¡¢Ëã×ÓÉî¶ÈÈںϡ¢¼ÆËã¸ß¶È²¢ÐУ¬¶Ô´ó Ä£ÐÍÐÔÄÜÉî¶ÈÓÅ»¯¡£ 3£©¿ª·ÅÉú̬£ºÈ«Ãæ¼æÈÝÒµ½çÈÚºÏËã×Ó¡¢AI ¿ò¼Ü¡¢¼ÓËÙ¿âºÍÖ÷Á÷´óÄ£ÐÍ¡£CANN ·¢Õ¹Ñ¸ËÙ£¬Í¬ CUDA ¸÷·½Ãæ²î¾à²»¶ÏËõС¡£CANN ºÍ OpenCL ¶¼ÊÇÒì¹¹¼ÆËã¼Ü¹¹£¬ÊôÓÚ¿ª·ÅʽÉú̬£¬¿É¶Ô½ÓÆäËûÀàÐÍ GPU£¬Ïà±ÈÓÚ½ö Ó¦ÓÃÓÚ×ÔÉí GPU µÄ CUDA ºÍ ROCm ÓÐÒ»¶¨ÓÅÊÆ£»ÔÚÔËÐÐÐÔÄÜ·½Ã棬 CANN ¿É½« Attenion ´¦ÀíÐÔÄÜÌáÉý 50£¬ËäÈ»ÕûÌåÐÔÄÜÈÔÈõÓÚ CUDA£¬ µ«ÒÑÓÐÆðÉ«£»ÔÚ¿ª·¢ÕßÊýÁ¿·½Ã棬2021 Äê CANN ÒÑÓµÓг¬ 60 Íò¿ª·¢ Õߣ¬½ØÖÁ 2023 ÄêÄêÄ©£¬•NÌÚ AI ¹²·¢Õ¹Á˳¬ 220 Íò¿ª·¢Õߣ¬·õ»¯ÁË 2600 ¸÷½â¾ö·½°¸£¬Í¬ CUDA µÄ 400 Íò¿ª·¢ÕßÊýÁ¿ºÍ 3000 Ó¦ÓóÌÐòµÄ²î¾àѸ ËÙËõС¡£AI ¿ò¼ÜÖØÏÖ¶à×㶦Á¢Ö®ÊÆ¡£AI ¿ò¼ÜÔµÆðÉñ¾­ÍøÂç·½·¨£¬Éñ¾­ÍøÂç·½·¨ÊÇ ÒÔͳһËã·¨Éè¼ÆÊӽǽâ¾ö¸÷ÀàÓ¦ÓÃÈÎÎñ²¢ÄâºÏº£Á¿Êý¾ÝµÄ·½·¨£¬Ëæ×Å¿ª ·¢Ð§ÂʺÍËãÁ¦µÄÐèÇó²»¶ÏÌá¸ß£¬Äܹ»Ìṩ¿ÉÊÓ»¯½çÃæ²¢×¨×¢ÓÚÓ¦ÓóÌÐò ÒµÎñÂß¼­µÄ AI ¿ò¼ÜÖð½¥µ®Éú¡£×Ô 2000 ÄêÆð£¬AI ¿ò¼Ü¾ºÕù¸ñ¾Ö´Ó×î³õµÄ MATLAB¡¢Numpy¡¢SciPyµ½2015ÄêµÄPyTorch£¨Facebook£©¡¢TensorFlow £¨Google£©Ë«Í·Â¢¶Ï£¬¾­ÀúÁËÒ»´Î´Î¾ºÕù¡ª¡ªÂ¢¶Ï¡ª¡ª¾ºÕùµÄÑ­»·¡£Ëæ ×Å´óÄ£ÐÍʱ´úµÄµ½À´£¬AI ¿ò¼ÜÒÑÐγÉÁËеľºÕù¸ñ¾Ö£¬³ý´«Í³µÄ Pytorch ºÍ TensorFlow Í⣬»ªÎª MindSpore¡¢¿õÊÓÌìÔª MegEngine¡¢°Ù¶È Paddle µÈÒ²Õ¼¾ÝÁËÒ»¶¨Êг¡·Ý¶î£¬Ðγɶà×㶦Á¢Ö®ÊÆ¡£•N˼ MindSpore Ö¼ÔÚʵÏÖÒ׿ª·¢¡¢¸ßЧִÐС¢È«³¡¾°¸²¸ÇÈý´óÄ¿±ê¡£ ÆäÖУ¬Ò׿ª·¢±íÏÖΪ API ÓѺᢵ÷ÊÔÄѶȵͣ»¸ßЧִÐаüÀ¨¼ÆËãЧÂÊ¡¢ Êý¾ÝÔ¤´¦ÀíЧÂʺͷֲ¼Ê½ÑµÁ·Ð§ÂÊ£»È«³¡¾°ÔòÖ¸¿ò¼Üͬʱ֧³ÖÔÆ¡¢±ßÔµ ÒÔ¼°¶Ë²à³¡¾°¡£MindSpore Ò×ÓÃÐÔÍ»³ö£¬Ö§³ÖÓïÑÔ½«¼ÌÐøÀ©³ä¡£Í¬ PyTorch¡¢TensorFlow¡¢ Paddle Ïà±È£¬MindSpore Ò×ÓÃÐÔÓÅÓÚ PyTorch ºÍ TensorFlow£¬Äܹ»½ö ÓÃÒ»ÐдúÂëÇл»¾²Ì¬Í¼ºÍ¶¯Ì¬Í¼»úÖÆ£»¼æÈÝÐÔÓÅÓÚ Paddle£¬ÊÊÓÃÓÚ¶àÖÖ CPU/GPU/TPU¡£¸ù¾Ý¡¶ÖйúÈ˹¤ÖÇÄÜ¿ò¼ÜÊг¡µ÷Ñб¨¸æ¡·£¬¿ª·¢ÕßÑ¡Ôñ AI ¿ò¼Üʱ£¬Ê×ÏÈ¿¼ÂǵÄÈý¸öÒòËØÊÇÒ×ÓÃÐÔ¡¢ÐÔÄÜ¡¢Ö§³ÖµÄÓ²¼þ£¬MindSpore µÄÈý·½Ãæ±íÏÖ¾ù½ÏΪͻ³ö£¬ºóÐøÒ²»á¶Ô½Ó C¡¢C++¡¢²Öò¡µÈÓïÑÔÒÔ±ãÀû ¸ü¶à¿ª·¢ÕßÐèÇó¡£MindSpore ¹úÄÚÈϿɶÈÅÅλµÚ¶þ£¬ÉçÇø»îÔ¾¶ÈÅÅλµÚËÄ£¬ÉçÇø¹æÄ£ÓÐÍû ½øÒ»²½Í»ÆÆ¡£Ëæ×Å MindSpore ѸËÙ·¢Õ¹£¬Öð½¥Îª¿ª·¢ÕßËù½ÓÊÜ¡£¸ù¾Ý¡¶ÖÐ ¹úÈ˹¤ÖÇÄÜ¿ò¼ÜÊг¡µ÷Ñб¨¸æ¡·Í³¼Æ£¬37%µÄ¿ª·¢ÕßÈÏΪ MindSpore ÊÇ ×îÊʺÏ×ö AI for science µÄ AI ¿ò¼Ü£¬ÅÅλµÚ¶þ£¬½ö´ÎÓÚ TensorFlow£»²¢±» 11%µÄ¿ª·¢ÕßÈÏΪÊÇÉçÇø»îÔ¾¶È±íÏÖ¸üºÃ£¬ÅÅλµÚËÄ£¬ºÍµÚÈýµÄ Paddle ÆëÍ·²¢½ø¡£¿¼Âǵ½ MindSpore ÊÇËĸö AI ¿ò¼ÜÖÐ×îÄêÇáµÄÒ»¸ö£¬ ÆäÉçÇø¹æÄ£ÓÐÍûʵÏÖеÄÍ»ÆÆ¡£3.2¡¢º®Îä¼Í£º¹úÄÚÁìÏ鵀 AI оƬÁúÍ·º®Îä¼ÍÊÇ AI оƬÁìÓòµÄ¶À½ÇÊÞ¡£¹«Ë¾³ÉÁ¢ÓÚ 2016 Äê 3 Ô 15 ÈÕ£¬ רעÓÚÈ˹¤ÖÇÄÜоƬ²úÆ·µÄÑз¢Óë¼¼Êõ´´Ð£¬²úÆ·¹ã·ºÓ¦ÓÃÓÚÏû·Ñµç×Ó¡¢ Êý¾ÝÖÐÐÄ¡¢ÔƼÆËãµÈÖî¶à³¡¾°¡£¹«Ë¾ÊÇ AI оƬÁìÓòµÄ¶À½ÇÊÞ£º²ÉÓù« ˾ÖÕ¶ËÖÇÄÜ´¦ÀíÆ÷ IP µÄÖÕ¶ËÉ豸Òѳö»õ¹ýÒŲ́£»ÔƶËÖÇÄÜоƬ¼°¼ÓËÙ ¿¨Ò²ÒÑÓ¦Óõ½¹úÄÚÖ÷Á÷·þÎñÆ÷³§É̵IJúÆ·ÖУ¬²¢ÒÑʵÏÖÁ¿²ú³ö»õ£»±ßÔµ ÖÇÄÜоƬ¼°¼ÓËÙ¿¨µÄ·¢²¼±êÖ¾×Ź«Ë¾ÒÑÐγÉÈ«Ãæ¸²¸ÇÔÆ¶Ë¡¢±ßÔµ¶ËºÍÖÕ ¶Ë³¡¾°µÄϵÁл¯ÖÇÄÜоƬ²úÆ·²¼¾Ö¡£È˹¤ÖÇÄܵĸ÷ÀàÓ¦Óó¡¾°£¬´ÓÔÆ¶ËÒç³öµ½±ßÔµ¶Ë£¬»òϳÁµ½ÖÕ¶Ë£¬¶¼Àë ²»¿ªÖÇÄÜоƬµÄ¸ßЧ֧³Å¡£¹«Ë¾ÃæÏòÔÆ¶Ë¡¢±ßÔµ¶Ë¡¢ÖÕ¶ËÍÆ³öÁËÈý¸öϵ Áв»Í¬Æ·ÀàµÄͨÓÃÐÍÖÇÄÜоƬÓë´¦ÀíÆ÷²úÆ·£¬·Ö±ðΪÖÕ¶ËÖÇÄÜ´¦ÀíÆ÷ IP¡¢ ÔÆ¶ËÖÇÄÜоƬ¼°¼ÓËÙ¿¨¡¢±ßÔµÖÇÄÜоƬ¼°¼ÓËÙ¿¨£¬ÆäÖÐÔÆ¶ËÖÇÄÜоƬÖ÷ ÒªÊÇÎªÔÆ¶ËÈ˹¤ÖÇÄÜ´¦ÀíÌṩǿ´óµÄ¼ÆËãÄÜÁ¦Ö§³Å£»ÔƶËÖÇÄܼÓËÙ¿¨ÊÇ »ùÓÚÔÆ¶ËÖÇÄÜоƬ£¬Ôö¼ÓÍâΧµç·ģ¿éÐγɵĿ¨°å²úÆ·£¬Í¨¹ýÖ÷»úµÄ¸½ ¼Ó½Ó¿Ú½ÓÈëϵͳ¡£º®Îä¼ÍÔÆ¶ËÍÆÀíÖ÷Òª°üº¬ 8 ¸ö²úÆ·£¬Ä¿Ç°µü´úÖÁ MLU370 ϵÁУ¬×î´ó·åÖµËãÁ¦¸ß´ï 256TOPS£¨INT8£©¡£º®Îä¼ÍÍÆÀíоƬ°üÀ¨ MLU100¡¢MLU270¡¢ MLU370 ºÍÐþ˼ 1001 µÈ 4 ¸öϵÁй² 8 ¸ö²úÆ·£¬ÆäÖÐ 2022 ÄêÍÆ³öµÄ MLU370 ϵÁлùÓÚ˫оƬËÄоÁ£Ë¼Ôª 370 ´òÔ졣˼Ԫ 370 оƬ²ÉÓà 7nm ÖÆ³Ì¹¤ÒÕ£¬ÊǺ®Îä¼ÍÊ׿ŲÉÓà chiplet оƬ¼¼ÊõµÄ AI оƬ£¬Ò²ÊǹúÄÚµÚ Ò»¿î¹«¿ª·¢²¼Ö§³Ö LPDDR5 ÄÚ´æµÄÔÆ¶Ë AI оƬ£»¹«Ë¾»¹»ùÓÚ 4 ÕÅ MLU370-X8 ²úÆ·¼¯³ÉÁËÐþ˼ 1001 ÖÇÄܼÓËÙÆ÷£¬ÒÔÔÚÉúÎïÐÅÏ¢¡¢Ò½ÁÆÓ° Ïñ¡¢ÓïÑÔÄ£Ð͵ÈÐÐÒµ¼°¿ÉÑØ³¤½­¹ã·ºÓ¦Óá£370 ϵÁÐÔÚ¸ßÃܶÈÔÆ¶ËÍÆÀíÁìÓò¾ßÓÐÃ÷ÏÔÓÅÊÆ¡£MLU370-X8 Ìṩ 256TOPS£¨INT8£©µÄ·åÖµËãÁ¦£¬¸ßÓÚӢΰ´ï L20¡£Í¬¹úÄÚÔÆ¶ËÍÆÀíоƬ Ïà±È£¬ÔÚ 150W ¹¦ºÄÍÆÀí¿¨ÖУ¬MLU370-X4 ·åÖµËãÁ¦ºÍÀ¥ÂØÐ¾ R200 ºÍ ìÝÔ­ I20Ò»Ö£¬Í¬Îª 256TOPS£¨INT8£©¡£ÔÚ¸ßÃܶÈÔÆ¶ËÍÆÀíÁìÓò£¬MLU370- S4 µÄÄܺıȸߴï 2.56£¬¾ßÓÐÏÔÖøÓÅÊÆ¡£È«ÃæÑз¢ÓÅ»¯ÍÆÀíÈí¼þƽ̨ģÐÍÐÔÄÜ¡¢´óÄ£ÐÍºÍ AIGC ÍÆÀíÒµÎñÖ§³Ö¡¢ ÍÆÀíÐÔÄÜÓÅ»¯Èý¸ö·½Ã棬ÖúÁ¦¿Í»§½µ±¾ÔöЧ¡£Ä£ÐÍÐÔÄÜÓÅ»¯·½Ã棬º®Îä ¼ÍÕë¶ÔÓïÒôºÏ³É¡¢ËÑË÷ÍÆ¼öºÍÊÓ¾õ´¦ÀíÖÐ¸ßÆµÊ¹ÓÃÍøÂç½øÐÐÁËÓÅ»¯£¬Ä¿ ǰ´ïµ½ÁË¿ÉÂäµØÒªÇó£»´óÄ£ÐÍºÍ AIGC ÍÆÀíÒµÎñÖ§³Ö·½Ã棬º®Îä¼ÍÑз¢ ´óÓïÑÔÄ£ÐÍ·Ö²¼Ê½ÍÆÀí¼ÓËÙ¿â BangTransformer£¬½øÐÐÁË LLaMA¡¢GLM¡¢ BLOOM¡¢GPT-2 µÈÖ÷Á÷Éú³Éʽ´óÓïÑÔÄ£Ð͵ÄÊÊÅ乤×÷£»ÔÚÍÆÀíÐÔÄÜÓÅ »¯·½Ã棬BangTransformer Ö§³ÖËã×ÓÈںϡ¢ÕÅÁ¿²¢ÐС¢Á¿»¯ÍÆÀí¡¢Flash Attention µÈÓÅ»¯ÌØÐÔ£¬ÓÃÓÚ¸¨ÖúͼÏñÉú³ÉµÄ MagicMind ÊÇÒµ½çÊ׸ö»ù ÓÚ MLIR ͼ±àÒë¼¼Êõ´ïµ½ÉÌÒµ»¯²¿ÊðÄÜÁ¦µÄÍÆÀíÒýÇæ£¬ÔÚ¹¦ÄÜ¡¢ÐÔÄÜ¡¢ ¼æÈÝÐÔÉ϶¼ÓÐÁ¼ºÃ±íÏÖ£¬Í¬Ê±»ùÓÚ MagicMind µ½ PyTorch µÄ¼¯³É£¬¿Í»§ ÎÞÐè´úÂëÇ¨ÒÆÒ²Äܹ»ÏíÊÜ MagicMind ´øÀ´µÄÐÔÄܼÓËÙ£¬Í¬Ê±£¬MagicMind ÐÂÔöÁ˶à¿îÔÆ¡¢±ß¡¢¶Ë¡¢³µÓ²¼þƽ̨֧³Ö£¬²¢ÍêÉÆÁË Sample Code¡¢Best Practice µÈÓû§Îĵµ£¬½øÒ»²½Ìá¸ßÁËÓû§Ê¹ÓÃÌåÑé¡£ÍÆÀíÈí¼þƽ̨Èý¸ö ά¶ÈµÄÑз¢ÓÅ»¯£¬´ó·ùÌáÉýÁËÍÆÀíÒµÎñÔËÐÐЧÂÊ£¬ÖúÁ¦¿Í»§½µ±¾ÔöЧ¡£2022-2023 Ä꺮Îä¼Í½ÓÁ¬»ñÒÚ¼¶¶©µ¥¡£½ØÖÁ 2023 Äê 12 Ô£¬ÖйúÒÆ¶¯ÒÑ ÓÐ 12 ¸öÊ¡¹«Ë¾¡¢³¬¹ý 70 ¸ö AI ÒµÎñÍê³ÉÏòº®Îä¼Í˼Ԫ£¨MLU£©ÏµÁÐÔÆ ¶ËÖÇÄܼÓËÙ¿¨µÄÇ¨ÒÆ£¬²¢ÔÚ¿ÉÐÐÐÔ¡¢Ò×ÓÃÐÔ¡¢ÔËËãÐÔÄÜ·½ÃæµÃµ½ÁËÁ¼ºÃ ·´Ï죬ʵ²âÖг¬Ô½¹ú¼ÊÖ÷Á÷²úƷˮƽ¡£2023 ÄêÄÚ£¬º®Îä¼ÍÏȺóÖбꡰÉò ÑôÊÐÆû³µ³ÇÐÂÐÍ»ù´¡ÉèÊ©½¨ÉèÏîÄ¿-ÖÇÄܼÆËãÖÐÐÄ¡±ºÍ¡°Õã¶«ÄÏÊý×Ö¾­¼Ã²úÒµÔ°Êý×Ö»ù´¡ÉèÊ©ÌáÉý¹¤³Ì£¨Ò»ÆÚ£©¡±Á½¸öÏîÄ¿£¬Ìṩ°üÀ¨µ«²»ÏÞÓÚÖÇÄÜ ¼ÆËã×Óϵͳ¡¢Êý¾Ý´æ´¢×Óϵͳ¡¢ÍøÂç½»»»×Óϵͳ¡¢Èí¼þƽ̨¡¢¼¯³É·þÎñ ºÍά±£·þÎñµÈ£¬ºÏ¼Æ¹±Ï×ÓªÊÕ´ï 9.08 ÒÚÔª¡£2022 Ä꣬º®Îä¼ÍÖбꡰÄϾ© ÖÇÄܼÆËãÖÐÐÄÏîÄ¿£¨¶þ¡¢ÈýÆÚ£©¡±ÏîÄ¿£¬¹±Ï×ÓªÊÕ 4.43 ÒÚÔª¡£ º®Îä¼ÍÊг¡ÈϿɶȳÖÐøÌáÉý£¬Ç©Êð¶à¸öÈ˹¤ÖÇÄÜÁìÓòºÏ×÷ЭÒé¡£2022- 2023 Ä꣬º®Îä¼ÍÏȺóÓë°Ù´¨ÖÇÄÜ¡¢Öе繤³Ì¡¢ÌìÍ«ÍþÊÓ´ï³ÉÕ½ÂÔºÏ×÷¡£ Ŀǰ£¬º®Îä¼ÍÒÑͬ°Ù´¨ÖÇÄÜÆìϵĴóÄ£ÐÍ Baichuan2-53B¡¢Baichuan2- 13B¡¢Baichuan2-7B µÈÒÑÍê³ÉÈ«ÃæÊÊÅ䣬ÖúÁ¦º®Îä¼Í˼Ԫ£¨MLU£©ÏµÁÐ ²úÆ·ÐÔÄܾù´ïµ½¹ú¼ÊÖ÷Á÷²úÆ·µÄˮƽ¡£´ËÍ⣬¹«Ë¾ÔƶËÓ²¼þ²úÆ·¶áµÃ¶à ¸ö½±Ï2018 Äê 11 Ô£¬ÓÚÉîÛÚ¾Ù°ìµÄµÚ¶þÊ®½ìÖйú¹ú¼Ê¸ßм¼Êõ³É¹û ½»Ò×»áÉÏ£¬º®Îä¼Í˼Ԫ 100 ÖÇÄÜоƬ¡¢Ë¼Ôª 100 ¼ÓËÙ¿¨Á¬ÐøÕ¶»ñ¸ß½»»á ×éί»á°ä·¢µÄ¡°ÓÅÐ㴴вúÆ·½±¡±£» 2019 Äê 10 Ô£¬Ë¼Ôª 270 оƬ»ñµÃµÚ Áù½ìÎÚÕòÊÀ½ç»¥ÁªÍø´ó»á¡°ÊÀ½ç»¥ÁªÍøÁìÏȿƼ¼³É¹û½±¡±£»2021 Äê 7 Ô£¬ ¹«Ë¾µÄ˼Ԫ 290 ÖÇÄÜоƬ¼°¼ÓËÙ¿¨¡¢Ðþ˼ 1000 ÖÇÄܼÓËÙÆ÷»ñµÃÁËÓÉÊÀ ½çÈ˹¤ÖÇÄÜ´ó»á×éί»á°ä·¢µÄ SAIL Ö®Ðǽ±£¬º®Îä¼ÍÓ°ÏìÁ¦³ÖÐøÌáÉý¡£3.3¡¢º£¹âÐÅÏ¢£º¹ú²ú CPU+DCU ÁúÍ·¹«Ë¾¹«Ë¾»ñ AMD ÊÚȨ£¬X86 Ö¸ÁÉú̬»·¾³·á¸»¡£¹«Ë¾³ÉÁ¢ÓÚ 2014 Ä꣬Ö÷ ÓªÒµÎñΪÑз¢¡¢Éè¼ÆºÍÏúÊÛÓ¦ÓÃÓÚ·þÎñÆ÷¡¢¹¤×÷Õ¾µÈ¼ÆËã¡¢´æ´¢É豸ÖÐ µÄ¸ß¶Ë´¦ÀíÆ÷ CPU ÒÔ¼°Éî¶È¼ÆËã´¦ÀíÆ÷ DCU µÈ¡£¹«Ë¾²úÆ·»ùÓÚ AMD ÊÚȨ¼¼Êõ£¬¼æÈÝÊг¡Ö÷Á÷µÄ x86 Ö¸Á£¬¾ßÓгÉÊì¶ø·á¸»µÄÓ¦ÓÃÉú̬»· ¾³¡£Í¬Ê±£¬º£¹â´¦ÀíÆ÷ÄÚÖÃרÓð²È«Ó²¼þ£¬Ö§³Ö¶àÖÖÏȽøµÄ©¶´·ÀÓù¼¼ Êõ£¬ÄÚÖøßÐÔÄܵĹúÃÜЭ´¦ÀíÆ÷ºÍÃÜÂëÖ¸Á£¬Ö§³Ö¿ÉÐżÆËãµÄ¹úÄÚ¡¢ ¹ú¼Ê±ê×¼£¬Ö§³ÖÁìÏȵĻúÃܼÆËã¼¼Êõ£¬Äܹ»½øÐÐÖ÷¶¯°²È«·ÀÓù£¬Í¨¹ýÁË Ïà¹ØÈ¨Íþ»ú¹¹µÄ°²È«²âÊÔ£¬Âú×ãÐÅÏ¢°²È«¡¢Êý¾ÝÒªËØ°²È«Á÷ͨµÄ·¢Õ¹Ðè Çó¡£¹«Ë¾µÄ²úÆ·°üÀ¨º£¹âͨÓô¦ÀíÆ÷£¨CPU£©ºÍº£¹âЭ´¦ÀíÆ÷£¨DCU£©¡£º£ ¹â CPU ϵÁвúÆ·¼æÈÝ x86 Ö¸ÁÒÔ¼°¹ú¼ÊÉÏÖ÷Á÷²Ù×÷ϵͳºÍÓ¦ÓÃÈí¼þ£¬ ÈíÓ²¼þÉú̬·á¸»£¬ÐÔÄÜÓÅÒ죬°²È«¿É¿¿¡£¹«Ë¾ CPU ¸ù¾Ý¸ßÖеͶËÓ¦Óó¡ ¾°·ÖΪ 7000¡¢5000¡¢3000 Èý¸öϵÁУ¬¸ù¾Ý²úÆ·´ú¼Ê¸÷ϵÁвúÆ·ÓÖ·ÖΪ Ò»¶þÈýËĺŲúÆ·£¬Ä¿Ç°¹«Ë¾Ö÷ÒªÏúÊÛ¶þ¡¢Èý´ú²úÆ·£¬Ëĺš¢ÎåºÅ²úÆ·ÔÚ Ñз¢ÖУ¬Ô¤¼ÆÃ÷ÄêËĺŲúƷʵÏÖ³ö»õ¡£ÆäÖÐ 7000 ϵÁÐÖ÷ÒªÓÃÓڸ߶˴¦ ÀíÆ÷£¬Öж˲úÆ·Ö÷ÒªÓÃÓÚÖеͶ˷þÎñÆ÷£¬µÍ¶Ë²úÆ·Ö÷ÒªÓÃÓÚ±ßÔµ¼ÆËã¡£º£¹â DCU ϵÁвúÆ·ÒÔ GPGPU ¼Ü¹¹Îª»ù´¡£¬¼æÈÝͨÓõġ°Àà CUDA¡±»· ¾³£¬¿É¹ã·ºÓ¦ÓÃÓÚ´óÊý¾Ý´¦Àí¡¢È˹¤ÖÇÄÜ¡¢ÉÌÒµ¼ÆËãµÈÓ¦ÓÃÁìÓò¡£º£¹â DCU ϵÁвúÆ·°üÀ¨ Z\K\E ϵÁУ¬ÉîËãÒ»ºÅΪ Z ϵÁУ¬E ´ú²úÆ·Ïà½ÏÓÚ K ´ú²úÆ·ÐÔÄÜ·­±¶£¬K ´ú²úÆ·Ïà½ÏÓÚ Z ´ú²úÆ··­±¶¡£Ä¿Ç° Z100L ÒÑʵÏÖ³ö »õ£¬E ϵÁÐÔÚÑÐÖС£¹«Ë¾²úÆ·¸²¸Ç¸ßÖеͶ˸÷Àೡ¾°£¬ÏÂÓÎÐÐÒµ°üÀ¨µçÐÅ¡¢½ðÈÚ¡¢»¥ÁªÍøµÈ¡£ 2019 Ä꣬¹«Ë¾Ö÷ÒªÏúÊÛÒ»´ú CPU ²úÆ·£¬ÒÔ 7100 ϵÁÐΪÖ÷£¬ÃæÏò¸ß¶Ë ·þÎñÆ÷Êг¡¡£ÒòΪ¹ú¼Ò¼¶½ÌÓý¿ÆÑÐÏîÄ¿ÖпÆÔº´óÆøËù¡°Ä£ÄâÆ÷×°Öá±ÏîÄ¿ ²É¹º´¦ÀíÆ÷£¬ËùÒÔ½ÌÓýÁìÓòÕ¼±È½Ï¶à¡£2020 Ä꣬¹«Ë¾ÍƳöº£¹â¶þºÅϵÁÐ ²úÆ·£¬ÊÜÒæÓÚǰÆÚÈÏÖ¤²âÊÔ£¬¹«Ë¾ÔÚµçÐÅÔËÓªÉ̼¯²É¡¢½ðÈÚÐÐÒµµÈÊг¡ ·Ý¶î¿ìËÙÔö³¤¡£ÆäÖÐ 5200 ϵÁвúÆ·ÍÆ³öºó¼´½øÈëµ³ÕþÁìÓòרÏîĿ¼£¬ ÏúÊÛ¿ìËÙÔö³¤¡£2021 Ä꣬µçÐÅ¡¢½ðÈÚÐÐÒµÐèÇóÔö³¤½Ï¿ì£¬¹«Ë¾²úÆ·½øÈë ¸üл»´úʱµã¡£¹«Ë¾ 7200¡¢3200 ϵÁвúƷͬʱ½øÈëµ³ÕþÁìÓòרÏîĿ¼£¬ 7200 ϵÁвúÆ·²¿·ÖÈ¡´ú 5200 ϵÁУ¬3200 ϵÁÐÔö³¤½Ï¿ì£¬3100¡¢5100 ϵÁвúÆ·½øÈëÏúÊÛÄ©ÆÚ¡£2021 ÄêϰëÄ꣬¹«Ë¾ 8000 ϵÁÐ DCU ²úƷʵÏÖÁ¿²ú£¬Ö÷ÒªÃæÏò·þÎñÆ÷¼¯Èº»òÊý¾ÝÖÐÐÄÊг¡£¬½øÒ»²½·á¸»Á˹«Ë¾µÄ²ú Æ·Ïß¡£¹«Ë¾ CPU ²úÆ·º£¹âÒ»ºÅ¡¢¶þºÅ¡¢ÈýºÅÒѾ­ÊµÏÖÉÌÒµ»¯Ó¦Ó᣹«Ë¾ CPU ²úÆ··¢Õ¹Â·¾¶¿É·ÖΪ£º¢Ù º£¹âÒ»ºÅ»ùÓÚ AMD ÊÚȨ¼¼Êõ£¬ÓÚ 2018 Äê 4 ÔÂʵÏÖÁ¿²ú¡£¢Ú¹«Ë¾ÔÚº£¹âÒ»ºÅ»ù´¡ÉÏ£¬¶Ô Core ΢½á¹¹½øÐÐÓÅ»¯£¬ÌáÉý ´¦ÀíÆ÷ºËÐÄÐÔÄܺͰ²È«Ó¦ÓÃÐÔÄÜ£¬º£¹â¶þºÅÓÚ 2020 ÄêʵÏÖÁ¿²ú¡£¢Û»ù ÓÚº£¹â¶þºÅ CPU£¬¹«Ë¾¶ÔºËÐÄºÍÆ¬ÉÏÍøÂç΢½á¹¹½øÐÐÉè¼ÆÓÅ»¯£¬»ùÓÚРµÄ¹¤ÒÕ½Úµã½øÐÐÉè¼Æ£¬º£¹âÈýºÅÓÚ 2022 ÄêʵÏÖÁ¿²ú¡£Ä¿Ç°º£¹âÈýºÅÒÑ ³ÉΪÖ÷Á¦ÏúÊÛ²úÆ·£¬º£¹âËĺš¢ÎåºÅÈÔÔÚÑз¢µ±ÖС£´ËÍ⣬º£¹â CPU °´ ÕÕ´ú¼Ê½øÐÐÉý¼¶µü´ú£¬Ã¿´ú¼Ê²úÆ·°´ÕÕ²»Í¬Ó¦Óó¡¾°¶Ô¸ß¶Ë´¦ÀíÆ÷¼ÆËã ÐÔÄÜ¡¢¹¦ÄÜ¡¢¹¦ºÄµÈ¼¼ÊõÖ¸±êµÄÒªÇó£¬Ï¸·ÖΪº£¹â 7000 ϵÁвúÆ·£¨×î¶à ¼¯³É 32 ¸ö´¦ÀíÆ÷ºËÐÄ£©¡¢º£¹â 5000 ϵÁвúÆ·£¨×î¶à¼¯³É 16 ¸ö´¦ÀíÆ÷ ºËÐÄ£©¡¢º£¹â 3000 ϵÁвúÆ·£¨×î¶à¼¯³É 8 ¸ö´¦ÀíÆ÷ºËÐÄ£©¡£º£¹â CPU ÊÊÅäÖ÷Á÷Éú̬£¬Òѵõ½À˳±¡¢ÁªÏ롢лªÈý¡¢Í¬·½µÈ¶à¼Ò¹úÄÚ ÖªÃû·þÎñÆ÷³§É̵ÄÈϿɡ£¹«Ë¾ CPU ¼æÈݹú¼ÊÖ÷Á÷ x86 ´¦ÀíÆ÷¼Ü¹¹ºÍ¼¼ Êõ·Ïߣ¬¾ßÓÐÓÅÒìµÄÉú̬ÓÅÊÆ¡£¹«Ë¾²úÆ·º£¹â CPU7285 µÄ SPEC CPU 2017 ʵ²âÐÔÄÜÓë¹ú¼ÊÁìÏÈоƬÉè¼ÆÆóÒµ Intel ͬÆÚ·¢²¼µÄÖ÷Á÷´¦ÀíÆ÷ ²úÆ·µÄʵ²âÐÔÄÜ×ÜÌåÏ൱£¬¾ß±¸Á¼ºÃµÄ²úÆ·ÐÔÄÜ¡£GPU ¾ÞÍ·Ö®Õù£º¼Ü¹¹ÏȽøÐÔÓëÉú̬¡£´ÓӢΰ´ïºÍ AMD µÄ¾ºÕùÀ´¿´£¬GPU µÄºËÐÄÔÚÓڼܹ¹µÄÏȽøÐÔºÍÍêÉÆµÄÉú̬¡£¼Ü¹¹ÏȽøÐÔ·½Ã棬Ӣΰ´ïÿÁ½ Äê»á¸üÐÂÒ»´Î¼Ü¹¹£¬Ã¿´Îµü´ú¶¼ÒâζןüÏȽøµÄÖÆ³Ì¡¢¸ü¶àµÄ¼ÆËã´¦Àí µ¥Ôª¡£Éú̬·½Ã棬CUDA ·¢Õ¹ÖÁ½ñÒѾ­½¨Á¢ÁËÇ¿´óµÄÉú̬Ìåϵ¡£Éú̬µÄ ±¾ÖÊÊǶÔÓû§**¹ßµÄÅàÑø£¬CUDA Ç¿´óµÄÈí¼þ¸²¸ÇÂÊºÍ AI Ö§³Ö¿ò¼Üʹ ÆäÄÑÒÔÌæ´ú£¬AMD Ìá³öµÄ ROCm ×îÓÐÏ£ÍûÌæ´ú CUDA¡£Óɴ˿ɼû£¬ÄÜ Í¬Ê±ÊÊÅä CUDA µÈ¶àÖÖÉú̬ÇÒÐÔÄÜÓÅÒìµÄ GPU ½«¾ßÓиüÇ¿µÄ¾ºÕùÁ¦¡£¹«Ë¾²úÆ·ÐÔÄÜÓÐÍû¶Ô±êӢΰ´ï A100¡£¹«Ë¾ÉîËãÒ»ºÅ DCU ²ÉÓà 7nm ¹¤ ÒÕ£¬ÔÚµäÐÍÓ¦Óó¡¾°ÖУ¬ÐÔÄÜæÇÃÀӢΰ´ï A100 ºÍ AMD MI100¡£¹«Ë¾ DCU È«Ãæ¼æÈÝ ROCm GPU ¼ÆËãÉú̬£¬Äܹ»½ÏºÃµØÊÊÅä¹ú¼ÊÖ÷Á÷ÉÌÒµ¼Æ ËãÈí¼þ£¬½â¾öÁ˲úÆ·ÍÆ¹ã¹ý³ÌÖеÄÈí¼þÉú̬¼æÈÝÐÔÎÊÌ⣬¾ß±¸Á¼ºÃµÄÉú ̬ÊÊÅäÄÜÁ¦¡££¨±¾ÎĽö¹©²Î¿¼£¬²»´ú±íÎÒÃǵÄÈκÎͶ×ʽ¨Òé¡£ÈçÐèʹÓÃÏà¹ØÐÅÏ¢£¬Çë²ÎÔı¨¸æÔ­ÎÄ¡££©¾«Ñ¡±¨¸æÀ´Ô´£º¡¾Î´À´Öǿ⡿¡£

Êг¡·ÖÎö