Внедрение инфраструктуры искусственного интеллекта Cisco в центры обработки данных (DCAI) Implementing Cisco Data Center AI Infrastructure (DCAI)

Этот курс поможет:
  • Получить комплексные навыки по поддержке, защите и оптимизации рабочих нагрузок искусственного интеллекта в современных средах центров обработки данных 
  • Изучить проектирование, внедрение и расширенное устранение неполадок инфраструктуры ИИ, включая сетевые сложности и специализированное оборудование
  • Получить углублённые знания концепций AI/ML, генеративного искусственного интеллекта и их практического применения в управлении и автоматизации сетей
  • Освоить практические методы мониторинга, диагностики и устранения неисправностей с использованием инструментов, таких как Splunk, а также применения ИИ для повышения эффективности сетевых операций
  • Подготовиться к экзамену 300-640 DCAI  

Программа курса:

  • Основы искусственного интеллекта  
  • Генеративный искусственный интеллект  
  • Сценарии применения ИИ  
  • AI/ML-кластеры и модели  
  • Набор инструментов ИИ — Jupyter Notebook  
  • Инфраструктура ИИ  
  • Размещение и совместимость AI-нагрузок  
  • Политики ИИ  
  • Устойчивость и энергоэффективность ИИ  
  • Проектирование инфраструктуры ИИ  
  • Основные сетевые вызовы и требования для AI-нагрузок  
  • Транспортные технологии ИИ  
  • Модели подключения  
  • Сеть для ИИ  
  • Миграция архитектуры к AI/ML-сетям  
  • Протоколы прикладного уровня  
  • Высокопроизводительные конвергентные фабрики  
  • Построение сетей без потерь (Lossless Fabrics)  
  • Контроль и видимость перегрузок  
  • Подготовка данных для ИИ  
  • Производительность данных для AI/ML-нагрузок  
  • Аппаратное обеспечение для ИИ  
  • Вычислительные ресурсы  
  • Решения для вычислительных ресурсов  
  • Виртуальные ресурсы  
  • Ресурсы хранения данных  
  • Настройка AI-кластера  
  • Развертывание и использование open-source GPT-моделей для RAG  
  • Эксплуатация и мониторинг инфраструктуры ИИ  
  • Устранение неполадок инфраструктуры ИИ  
  • Устранение типовых проблем в AI/ML Fabric 

Вы научитесь:

  • Описывать ключевые концепции искусственного интеллекта, включая традиционный ИИ, машинное обучение и методы глубокого обучения, а также их применение  
  • Описывать генеративный искусственный интеллект, связанные с ним вызовы и перспективы развития, а также различия между традиционными и современными методологиями ИИ  
  • Объяснять, как ИИ улучшает управление и безопасность сетей с помощью интеллектуальной автоматизации, предиктивной аналитики и обнаружения аномалий  
  • Описывать ключевые концепции, архитектуру и базовые принципы управления AI/ML-кластерами, а также процессы получения, тонкой настройки, оптимизации и использования предварительно обученных ML-моделей  
  • Использовать возможности Jupyter Lab и генеративного ИИ для автоматизации сетевых операций, написания Python-кода и применения AI-моделей для повышения производительности  
  • Описывать основные компоненты и требования для построения надёжной инфраструктуры ИИ  
  • Оценивать и внедрять эффективные стратегии размещения нагрузок и обеспечивать совместимость компонентов AI-систем  
  • Изучать стандарты соответствия, политики и модели управления, применяемые к AI-системам  
  • Описывать практики устойчивой инфраструктуры ИИ с акцентом на экологическую и экономическую эффективность  
  • Принимать решения по инфраструктуре ИИ для оптимизации производительности и затрат  
  • Описывать основные сетевые вызовы с точки зрения требований AI/ML-приложений  
  • Описывать роль оптических и медных технологий в обеспечении работы AI/ML-нагрузок в центрах обработки данных  
  • Описывать модели сетевого подключения и сетевые архитектуры  
  • Описывать ключевые протоколы уровней Layer 2 и Layer 3 для ИИ и fog computing в распределённой обработке AI  
  • Выполнять миграцию AI-нагрузок в специализированную AI-сеть  
  • Объяснять механизмы и принципы работы протоколов RDMA и RoCE  
  • Понимать архитектуру и особенности высокопроизводительных Ethernet Fabric  
  • Объяснять сетевые механизмы и инструменты QoS, необходимые для построения высокопроизводительных сетей RoCE без потерь  
  • Описывать механизмы ECN и PFC, использовать Cisco Nexus Dashboard Insights для мониторинга перегрузок, а также анализировать влияние различных этапов AI/ML-приложений на инфраструктуру ЦОД и наоборот  
  • Изучать основные этапы, сложности и методы подготовки данных  
  • Использовать Cisco Nexus Dashboard Insights для мониторинга AI/ML-трафика  
  • Описывать важность специализированного AI-оборудования для сокращения времени обучения моделей и поддержки расширенных вычислительных требований AI-задач  
  • Понимать вычислительное оборудование, необходимое для работы AI/ML-решений  
  • Понимать существующие интеллектуальные и AI/ML-решения  
  • Описывать варианты виртуальной инфраструктуры и особенности их использования при развертывании  
  • Объяснять стратегии хранения данных, протоколы хранения и программно-определяемые системы хранения  
  • Использовать NDFC для настройки Fabric, оптимизированной под AI/ML-нагрузки  
  • Использовать локально размещённые GPT-модели с RAG для задач сетевой инженерии 

Предварительные требования:

Для успешного прохождения данного курса слушателям рекомендуется обладать следующими знаниями и навыками: 

  • Архитектура и эксплуатация вычислительных систем Cisco UCS  
  • Линейка коммутаторов Cisco Nexus и их функциональные возможности  
  • Базовые технологии центров обработки данных 
Записаться на курс Implementing Cisco Data Center AI Infrastructure (DCAI)