Новий нейроморфний чіп для ШІ на периферії, при малій частці енергії та розміру сучасних обчислювальних платформ
Міжнародна група дослідників розробила і створила чіп, який виконує обчислення безпосередньо в пам’яті та може запускати широкий спектр застосунків ШІ – і все це за малої частки енергії, споживаної обчислювальними платформами для обчислень ШІ загального призначення.
Нейроморфний чіп NeuRRAM робить ШІ ще на крок ближче до того, щоб працювати на широкому спектрі периферійних пристроїв, від’єднаних від хмари, де вони можуть виконувати складні когнітивні завдання будь-де і будь-коли, не покладаючись на мережеве підключення до централізованого сервера. Пристроям знайдеться застосування в усіх куточках світу і в усіх сферах нашого життя – від розумних годинників до гарнітур віртуальної реальності, розумних навушників, розумних датчиків на заводах і роверів для дослідження космосу.
Чіп NeuRRAM не тільки вдвічі енергоефективніший за сучасні чіпи “обчислення в пам’яті” – інноваційний клас гібридних чіпів, що виконують обчислення в пам’яті, – а й забезпечує результати, що не поступаються за точністю звичайним цифровим чіпам. Звичайні платформи ШІ набагато громіздкіші і, як правило, обмежені використанням великих серверів даних, що працюють у хмарі.
Крім того, чіп NeuRRAM дуже універсальний і підтримує безліч різних моделей і архітектур нейронних мереж. В результаті чіп можна використовувати для безлічі різних додатків, включаючи розпізнавання і реконструкцію зображень, а також розпізнавання голосу.
“Заведено вважати, що вища ефективність обчислень у пам’яті досягається ціною універсальності, але наш чіп NeuRRAM забезпечує ефективність, не жертвуючи універсальністю”, – сказав Вейєр Ван, перший автор статті та нещодавній випускник Стенфордського університету, який здобув ступінь доктора філософії і який працював над чіпом у Каліфорнійському університеті в Сан-Дієго, де він працював під керівництвом Герта Каувенбергса на факультеті біоінженерії.
Дослідницька група під керівництвом біоінженерів з Каліфорнійського університету в Сан-Дієго представила свої результати у випуску журналу Nature від 17 серпня.
Наразі обчислення ШІ вимагають великих витрат енергії та обчислювальних ресурсів. Більшість додатків ШІ на периферійних пристроях припускають передачу даних з пристроїв у хмару, де ШІ обробляє й аналізує їх. Потім результати повертаються назад на пристрій. Це пов’язано з тим, що більшість периферійних пристроїв працюють від батарей і, як наслідок, мають обмежену кількість енергії, яка може бути виділена для обчислень.
Знижуючи енергоспоживання, необхідне для виводів ШІ на періферії, цей чіп NeuRRAM може призвести до створення більш надійних, більш розумних і доступних пристроїв на на періферії та більш розумного виробництва. Це також може призвести до поліпшення конфіденційності даних, оскільки передача даних з пристроїв у хмару пов’язана з підвищеними ризиками безпеки.
У чіпах ШІ переміщення даних з пам’яті в обчислювальні блоки є одним з основних вузьких місць.
“Це еквівалентно восьмигодинній поїздці на роботу заради двогодинного робочого дня”, – каже Ван.
Щоб вирішити проблему передачі даних, дослідники використовували так звану резистивну пам’ять із довільним доступом – тип енергонезалежної пам’яті, що дає змогу проводити обчислення безпосередньо в пам’яті, а не в окремих обчислювальних блоках. RRAM та інші нові технології пам’яті, які використовують як масиви синапсів для нейроморфних обчислень, вперше розробили в лабораторії Філіпа Вонга, радника Вана в Стенфорді й одного з головних авторів цієї роботи. Обчислення з використанням чіпів RRAM не є чимось новим, але зазвичай це призводить до зниження точності обчислень, що виконуються на чіпі, і відсутності гнучкості в архітектурі чіпа.
“Обчислення в пам’яті були звичайною практикою в нейроморфній інженерії з моменту її появи понад 30 років тому”, – сказав Каувенбергс. “Новим у NeuRRAM є те, що надзвичайна ефективність тепер поєднується з великою гнучкістю для різноманітних застосунків ШІ майже без втрати точності порівняно зі стандартними цифровими обчислювальними платформами загального призначення”.
Ключем до роботи стала ретельно розроблена методологія з кількома рівнями “кооптимізації” на всіх рівнях абстракції апаратного та програмного забезпечення, від проєктування чіпа до його конфігурації для виконання різних завдань ШІ. Крім того, команда подбала про те, щоб врахувати різні обмеження, починаючи від фізики пристроїв пам’яті та закінчуючи схемами й архітектурою мережі.
“Тепер цей чіп надає нам платформу для розв’язання цих проблем по всьому стеку – від пристроїв і схем до алгоритмів”, – сказав Сіддхарт Джоші, доцент кафедри комп’ютерних наук та інженерії Університету Нотр-Дам, який почав працювати над проєктом як аспірант і постдокторанта в лабораторії Каувенберга в Каліфорнійському університеті в Сан-Дієго.
Продуктивність чіпа
Дослідники вимірювали енергоефективність чіпу за допомогою показника, відомого як продукт затримки енергії, або EDP. EDP об’єднує кількість енергії, споживаної під час кожної операції, і час, необхідний для її виконання. За цим показником чіп NeuRRAM досягає в 1,6-2,3 раза меншого EDP (менше – краще) і в 7-13 разів більшої обчислювальної щільності, ніж сучасні чіпи.
Дослідники виконали на чіпі різні завдання штучного інтелекту. Він досяг 99% точності в завданні розпізнавання рукописних цифр, 85,7% у завданні класифікації зображень і 84,7% у завданні розпізнавання мовних команд Google. Крім того, у завданні відновлення зображення чіп домігся 70%-вого зниження помилок під час відновлення зображення. Ці результати можна порівняти з наявними цифровими чіпами, які виконують обчислення з тією ж точністю до біта, але з істотною економією енергії.
Наступні кроки включають вдосконалення архітектури та схем, а також масштабування конструкції на більш сучасні технологічні вузли. Дослідники також планують зайнятися іншими додатками, такими як шиповані нейронні мережі.
“Ми можемо домогтися більшого на рівні пристроїв, поліпшити схемотехніку для реалізації додаткових можливостей і розв’язувати різні завдання за допомогою нашої динамічної платформи NeuRRAM”, – сказав Раджкумар Кубендран, доцент Піттсбурзького університету, який розпочав роботу над проєктом, будучи аспірантом у дослідницькій групі Каувенбергса в Каліфорнійському університеті в Сан-Дієго.
Крім того, Ван є одним із засновників стартапу, який працює над створенням технології “обчислення в пам’яті”. “Як дослідник та інженер, я прагну довести дослідницькі інновації з лабораторій до практичного застосування”, – каже Ван.
Нова архітектура
Ключем до енергоефективності NeuRRAM є інноваційний метод визначення виводу в пам’яті. Традиційні підходи використовують напругу як вхідний сигнал і вимірюють струм як результат. Але це призводить до необхідності створення більш складних і більш енергоємних схем. У NeuRRAM команда розробила нейронну схему, яка сприймає напругу і виконує аналого-цифрове перетворення енергоефективним способом. Таке визначення режиму напруги може активувати всі рядки і всі стовпці масиву RRAM за один обчислювальний цикл, що дає змогу підвищити паралелізм.
В архітектурі NeuRRAM схеми нейронів КМОП фізично чергуються з вагами RRAM. Це відрізняється від звичайних конструкцій, де КМОП-схеми зазвичай розташовані на периферії ваг RRAM. З’єднання нейрона з масивом RRAM можуть бути налаштовані так, щоб служити або входом, або виходом нейрона. Це дає змогу нейронній мережі робити висновки в різних напрямках потоку даних без збільшення площі та енергоспоживання. Це, своєю чергою, полегшує реконфігурацію архітектури.
Щоб переконатися, що точність обчислень ШІ може бути збережена в різних архітектурах нейронних мереж, дослідники розробили набір методів кооптимізації апаратних алгоритмів. Ці методи були перевірені на різних нейронних мережах, включно зі згортковими нейронними мережами, довготривалою короткочасною пам’яттю та обмеженими машинами Больцмана.
Як нейроморфний чіп ШІ, NeuroRRAM виконує паралельну розподілену обробку даних на 48 нейросинаптичних ядрах. Щоб одночасно досягти високої універсальності та ефективності, NeuRRAM підтримує паралелізм даних, відображаючи шар у моделі нейронної мережі на кілька ядер для паралельного виведення даних. Крім того, NeuRRAM забезпечує паралелізм моделей, відображаючи різні шари моделі на різні ядра і виконуючи виводи конвеєрним способом.
Міжнародна дослідницька група
Ця робота є результатом роботи міжнародної команди дослідників.
Команда UC San Diego розробила КМОП-схеми, що реалізують нейронні функції, які взаємодіють з масивами RRAM для підтримки синаптичних функцій в архітектурі чіпа, що забезпечує високу ефективність і універсальність. Ван, працюючи в тісній співпраці з усією командою, реалізував дизайн, охарактеризував чіп, навчив моделі ШІ та провів експерименти. Ван також розробив програмний інструментарій для створення карт додатків ШІ на чіпі.
Масив синапсів RRAM і умови його роботи було ретельно охарактеризовано й оптимізовано в Стенфордському університеті.
Масив RRAM був виготовлений та інтегрований у КМОП в Університеті Цінхуа.
Команда з Нотр-Дама зробила внесок як у розробку дизайну та архітектури чіпа, так і в подальше створення і навчання моделей машинного навчання.
Схожі статті
Глибоке навчання за допомогою світла: Компоненти моделі машинного навчання закодовані у світлових хвилях
Попросіть пристрій “розумного будинку” дізнатися прогноз погоди, і на відповідь піде кілька секунд. Одна з причин такої затримки полягає в
Читати далі…
Програмне забезпечення з відкритим вихідним кодом допомагає дослідженням у галузі робототехніки
Дослідники з Карнегі-Меллон розробили програмне забезпечення з відкритим вихідним кодом, яке дає змогу спритніше пересуватися роботам на ногах. Роботи можуть
Читати далі…
П’ять сфер, які за допомогою метавсесвіту можуть стати революційними для людей з обмеженими можливостями
Винахід всесвітньої павутини в 1989 році зрештою призвів до появи інструментів, що змінюють життя кожного, хто може отримати до неї
Читати далі…
Використання невеликих безпілотників для вимірювання швидкості вітру в полярних регіонах
Дрони та аналогічні малі безпілотні літальні апарати (БПЛА) за останні кілька років набули величезного сплеску популярності завдяки інноваційному застосуванню, такому
Читати далі…
Нова модель штучного інтелекту може допомогти запобігти руйнівним і дорогим витокам даних
Експерти в галузі конфіденційності створили алгоритм штучного інтелекту(ШІ), який автоматично перевіряє системи, що зберігають конфіденційність, щодо потенційного витоку даних. Це
Читати далі…
Світ фальшивої реклами настане в цьому десятилітті
Маніпульована реклама стає дедалі поширенішим явищем у маркетингу. Такі технології, як deepfakes, використовують штучний інтелект і машинне навчання для створення
Читати далі…