Вычислительная система NVIDIA® Tesla™ – вычислительные решения на GPU
Поднимая производительность рабочей станции до уровня небольшого кластера, вычислительный процессор NVIDIA® TeslaTM C1060 позволяет достигнуть энергетически эффективных параллельных вычислений. Вычислительная система NVIDIA® TeslaTM C1060 представляет из себя двухслотовое устройство с активным охлаждением, которое устанавливается в разъем PCI-Express X16 на материнской плате рабочей станции. Внешне плата Nvidia Tesla выглядит схоже со старшими моделями видеокарт Quadro (и GeForce), только в отличие от них не имеет внешних разъемов.
NVIDIA® TeslaTM C1060 превращает рабочую станцию в высокопроизводительную вычислительную машину, по мощности превосходящую небольшой кластер. Теперь технические специалисты могут воспользоваться специализированным вычислительным ресурсом в настольном формате, который работает быстрее и более эффективно расходует энергию, чем небольшой кластер дата-центра. Основой Tesla C1060 стал многоядерный процессор Tesla, использующий всю мощь параллельных вычислений, и поддерживающий стандартную среду программирования CUDA C, что значительно облегчает разработки для многоядерных процессоров.
Вычисления на GPU — это использование GPU (графического процессора) для научных и технических вычислений общего назначения.
Модель вычислений на GPU подразумевает совместное использование CPU и GPU в гетерогенной вычислительной модели. Последовательная часть приложения работает на CPU, а вычислительно-тяжелая часть на GPU. С точки зрения пользователя приложение работает быстрее, потому что оно использует высокую производительность GPU для повышения производительности.

Разработчик приложения должен изменить свое приложение так, чтобы вычислительно-тяжелые задачи переносились на GPU. Остальная часть приложения выполняется на CPU. Перенос функции на GPU подразумевает переписывание функции с целью добавления параллелизма и ключевых слов “C” для переноса данных с/на GPU.
Вычисления на GPU выполняются архитектурой параллельных вычислений CUDA графических процессоров NVIDIA. Архитектура CUDA состоит из сотен процессорных ядер, которые работают в связке, чтобы разом справится с набором данных в приложении.
GPU серии Tesla 10 — это архитектура CUDA второго поколения с возможностями, предназначенными для научных приложений, такими как аппаратная поддержка вычислений двойной точности, общая разделяемая память и объединенные обращения в глобальную память.
Аппаратной архитектуре параллельных вычислений CUDA сопутствует среда программирования CUDA, которая обеспечивает набор абстракций, позволяющих выражать как паралеллизм данных, так и параллелизм задач. Программист сам выбирает средства разработки: языки высокого уровня, такие как C, C++, Fortran, или же API — OpenCL™ и DirectX™-11 Compute.
