
Amazon Web Services предоставила свою стратегия искусственного интеллекта Сделав ряд объявлений, которые укрепляют как ее собственный портфель чипов, так и ее технологический альянс с Nvidia, компания подробно рассказала о том, как она будет интегрировать технологии Nvidia в свои будущие ИИ-процессоры, а также представила новые серверы, предназначенные для обучения и развертывания крупномасштабных моделей ИИ на своей крупной ежегодной конференции по облачным вычислениям в Лас-Вегасе.
Этот шаг ещё больше укрепляет позиции AWS в гонке за искусственный интеллект, где компания напрямую конкурирует с такими гигантами, как Microsoft, Google и Meta. Amazon не просто перепродаёт сторонние графические процессоры, но и делает ставку на сочетание собственных чипов, специализированных межсоединений и соглашений с Nvidia. предложить европейским и глобальным компаниям больше возможностей по производительности и стоимости.
Trainium4: следующий чип Amazon будет говорить на языке Nvidia
Одним из наиболее примечательных объявлений стало подтверждение того, что будущий чип для обучения искусственного интеллекта компании, известный как Трейниум4, будет включать технологию межсоединений Nvidia NVLink FusionЭто решение обеспечивает сверхбыструю связь между процессорами, что критически важно, когда тысячи машин должны работать согласованно для обучения больших языковых моделей.
NVLink считается одним из важнейших активов Nvidia в области высокопроизводительных центров обработки данных, и до сих пор он в основном ассоциировался с конфигурациями, основанными исключительно на собственных графических процессорах компании. Решение Amazon интегрировать эту технологию в Trainium4 означает, что её будущие кластеры искусственного интеллекта смогут объединять чипы AWS и графические процессоры Nvidia в одной инфраструктуре, что упрощает Гибридные архитектуры.
Хотя AWS не назвала конкретных дат выхода Trainium4 на рынок, компания четко обозначила свою цель: предложить платформу, которая позволит клиентам продолжать использовать преимущества экосистемы программного обеспечения Nvidia, особенно CUDA, одновременно перенося часть своих рабочих нагрузок на оборудование, разработанное Amazon, в поисках лучшей доступности и цены.
Эта совместимость особенно важна для организаций в Европе и Испании, которые уже стандартизировали графические процессоры Nvidia и оптимизированные библиотеки, но сталкиваются с ограничения мощности или увеличение затрат при масштабировании своих проектов генеративного ИИ.
Новые серверы с Trainium3: больше мощности и меньше энергии
Пока разработка Trainium4 продолжается в фоновом режиме, AWS уже запустила один из них в эксплуатацию. новое поколение серверов Основанные на чипе Trainium3. Эти устройства, доступные на конференции в Лас-Вегасе, предназначены для обучения больших моделей и получения больших объёмов данных в облачных сервисах искусственного интеллекта.
Каждый сервер интегрируется 144 чипа Trainium3 По данным компании, вычислительная мощность нового решения более чем в четыре раза превышает вычислительную мощность предыдущего поколения ИИ-оборудования AWS. Более того, при этом энергопотребление снижается примерно на 40%, что является ключевым фактором в условиях, когда стоимость электроэнергии и сетевые ограничения начинают сказываться на расширении центров обработки данных.
Дэйв Браун, вице-президент по сервисам вычислений и машинного обучения в AWS, подчеркнул, что цель состоит не только в том, чтобы похвастаться чистой мощью, но и в том, чтобы продемонстрировать клиентам ее существование. конкурентоспособная альтернатива с точки зрения соотношения цены и производительности по сравнению с традиционными графическими процессорами. Компания избегает называть абсолютные цифры, но настаивает на том, что скачок по сравнению с предыдущим поколением огромен.
Такое повышение эффективности особенно интересно для европейских операторов, где регуляторное и социальное давление на энергопотребление цифровой инфраструктуры постоянно растёт. Меньший расход электроэнергии при том же объёме обучения означает более устойчивые центры обработки данных и, возможно, более краткие счета-фактуры для бизнес-клиентов.
В рамках дорожной карты Amazon Trainium3 стремится не только обогнать Nvidia, но и снизить зависимость от внешних поставщиков и укрепить собственная линейка ИИ-чипов которые могут развиваться в соответствии с циклами, более контролируемыми компанией.
Фабрики ИИ: выделенная инфраструктура в наших собственных центрах обработки данных
Еще одно объявление, которое привлекло много внимания, – это запуск так называемого Фабрики ИИ от AWS, продукт, разработанный для крупных компаний и государственных администраций, которые хотят использовать передовые системы искусственного интеллекта на своих устройствах. собственные центры обработки данных, не отказываясь от интеграции с облаком Amazon.
На бумаге модель проста: клиент предоставляет физическое пространство и электроэнергию, а AWS берёт на себя установку, управление и поддержку системы искусственного интеллекта, подключая её к остальным сервисам платформы. Таким образом, европейские компании со строгими нормативными требованиями или правительства, обеспокоенные суверенитетом данных, могут поддерживать полный контроль над конфиденциальной информацией не подвергая его воздействию внешней инфраструктуры.
Термин «фабрики искусственного интеллекта» (AI Factory) не случаен. Nvidia использует тот же концепт для обозначения своих аппаратных систем, оптимизированных для искусственного интеллекта, и в данном случае решение AWS разрабатывается именно в сотрудничестве с производителем графических процессоров. AI Factory от Amazon будет объединять Чипсы Blackwell от Nvidia и нового Trainium3, использующего облачные сетевые технологии, хранилище и безопасность AWS.
Помимо аппаратного обеспечения, эти объекты могут быть интегрированы с управляемыми услугами, такими как Коренная порода Амазонки —организовать и внедрить основополагающие модели ИИ—и AWS SageMaker, ориентированная на разработку и обучение собственных моделей. Для компаний это означает высокопроизводительную среду искусственного интеллекта, развёрнутую в гибридной облачной среде, которая лучше адаптируется к местным нормам в отношении данных.
Тем временем другие крупные поставщики, такие как Microsoft, также движутся в том же направлении, создавая локальные центры обработки данных и решения, направленные на обеспечение суверенитета данных. Приверженность Amazon своим «фабрикам искусственного интеллекта» отражает степень, в которой искусственный интеллект подталкивая облачных гигантов к более гибридным моделямотход от чисто централизованной модели десятилетней давности.
Модели Nova и Sonic и рост предложения ИИ от AWS
Наряду с инновациями в области оборудования, Amazon использовала конференцию для укрепления своего программного обеспечения, представив новые версии своих моделей искусственного интеллекта, объединенных под брендом Новая звездаКомпания представила Нова 2, эволюция, которая обещает большую скорость и отзывчивость по сравнению с предыдущим поколением.
Один из вариантов Nova способен взаимодействовать с пользователями не только посредством текста, но и посредством изображения, голос и видеоЭто расширяет потенциальные возможности применения в таких секторах, как обслуживание клиентов, онлайн-образование и создание контента. Эта мультимодальная возможность ставит его в один ряд с другими ведущими предложениями на рынке генеративного ИИ.
Кроме того, AWS представила модель под названием звуковой, ориентированная на голосовое взаимодействие. По словам Мэтта Гармана, генерального директора Amazon Web Services, эта система может реагировать на голосовые команды с качеством, приближенным к человеческому, открывая путь к более естественные разговорные помощники для государственных и частных услуг.
Хотя компания признает, что ее модели все еще сталкиваются с проблемой завоевания доли рынка по сравнению с такими конкурентами, как ЧатGPT (OpenAI), Клод (Антропный) o Близнецы (Google)Бизнес-показатели AWS за последний квартал указывают на уверенный рост. Продажи подразделения увеличились примерно на 20%, в основном благодаря спросу на ИИ-вычисления и инфраструктуру.
Для европейских компаний этот расширенный каталог означает больше возможностей при выборе платформы ИИ, как с точки зрения готовых к использованию моделей, так и с точки зрения... инфраструктура, на которой можно обучать собственные решения адаптированы к каждому сектору и местным правилам.
Жесткая конкуренция в гонке за чипы и инфраструктуру для ИИ
Все эти релизы происходят в контексте острая конкуренция на рынке чипы искусственного интеллектаNvidia сохраняет доминирующее положение благодаря своим графическим процессорам и мощи экосистемы CUDA, но такие компании, как Amazon, Google, Microsoft и даже традиционные производители процессоров, инвестируют миллионы, чтобы не остаться в стороне.
В случае AWS инвестиции в Trainium3 и будущий Trainium4 являются частью двойной стратегии. С одной стороны, она направлена на снизить зависимость от внешних поставщиков и лучше контролировать расходы и доступность своей инфраструктуры. С другой стороны, компания хочет предложить клиентам альтернативное оборудование, которое позволит им оптимизировать расходы без ущерба для производительности или совместимости с инструментами Nvidia.
С точки зрения рынка, сочетание собственных чипов, соглашений о сотрудничестве с Nvidia и таких продуктов, как AI Factory, позиционирует Amazon как игрока, способного конкурировать не только в сфере облачных сервисов, но и в сама основа оборудования что стимулирует новую волну приложений искусственного интеллекта.
Для компаний и государственных органов в Испании и Европе этот сценарий открывает более широкий спектр возможных инфраструктур — от публичного облака до локальных или гибридных центров обработки данных — с возможностью выбора между различными конфигурациями по цене, производительности и суверенитету данных. В секторе, где технологические решения прямое влияние на затратыСоблюдение нормативных требований и возможности инноваций, появление Trainium3, будущая интеграция с NVLink Fusion и AI Factories добавляют новые карты в колоду, которая, как можно предвидеть, еще больше ускорит внедрение масштабных решений на основе искусственного интеллекта.

