Cognition, лабораторія прикладного ШІ, що базується у Сполучених Штатах, представила те, що вона стверджує, є першим у світі програмним інженером ШІ. За словами її творців, агент ШІ на ім'я Девін успішно пройшов практичні інженерні співбесіди, проведені провідними компаніями ШІ.
Кажуть, що Девін також виконав реальні роботи, розміщені на Upwork, американській платформі для фрілансерів.
“Девін - невтомний, кваліфікований товариш по команді, готовий як працювати разом з вами, так і самостійно виконувати завдання для вашого перегляду. З Девіном інженери можуть зосередитися на більш цікавих проблемах, а інженерні команди можуть прагнути до більш амбітних цілей,” йдеться в офіційному блозі компанії.
!
AI-агент оснащений розвиненими можливостями в розробці програмного забезпечення, включаючи кодування, налагодження, вирішення проблем та інше. Девін використовує алгоритми машинного навчання, щоб постійно навчатися та покращувати свою продуктивність, адаптуючись до нових викликів, які виникають. Простими словами, Девін може конструювати та впроваджувати додатки з нуля до кінця, а також може навчати та вдосконалювати свої власні AI-моделі.
Девін здатний планувати та виконувати складні інженерні завдання, які зазвичай включають тисячі рішень. Ця здатність стала можливою завдяки досягненням Cognition у довгостроковому мисленні та плануванні. Згідно з інформацією компанії, Девін може отримувати відповідний контекст на кожному етапі, навчатися автономно з часом та виправляти помилки за потреби.
На бенчмарку SWE-Bench (, бенчмарку для оцінювання великих мовних моделей на реальних програмних питаннях, що знаходяться на GitHub), Девін правильно вирішив 13,86 відсотка питань без жодної допомоги, порівняно з 1,96 відсотка без допомоги та 4,80 відсотка з допомогою попередньої держави-найкращої моделі.
Хоча компанія детально описала можливості Девіна, деякі експерти висловлюють занепокоєння, що програміст-штучний інтелект може зіткнутися з труднощами у випадках із складними вимогами або сценаріями, які залежать від людської інтуїції та креативності. Крім того, інструменти штучного інтелекту, такі як Девін, викликають побоювання щодо можливого вивільнення робочих місць.
Проте деякі особи вважають, що Девін міг би стати цінним партнером для численних програмістів, відкриваючи нові можливості для співпраці між людською творчістю та ШІ.
Слідкуйте за нами в Twitter для останніх публікацій та оновлень
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
ПРЕЗЕНТАЦІЯ | Перший у світі AI програмний інженер, Девін, завершив реальні роботи на Upwork
Cognition, лабораторія прикладного ШІ, що базується у Сполучених Штатах, представила те, що вона стверджує, є першим у світі програмним інженером ШІ. За словами її творців, агент ШІ на ім'я Девін успішно пройшов практичні інженерні співбесіди, проведені провідними компаніями ШІ.
Кажуть, що Девін також виконав реальні роботи, розміщені на Upwork, американській платформі для фрілансерів.
“Девін - невтомний, кваліфікований товариш по команді, готовий як працювати разом з вами, так і самостійно виконувати завдання для вашого перегляду. З Девіном інженери можуть зосередитися на більш цікавих проблемах, а інженерні команди можуть прагнути до більш амбітних цілей,” йдеться в офіційному блозі компанії.
!
AI-агент оснащений розвиненими можливостями в розробці програмного забезпечення, включаючи кодування, налагодження, вирішення проблем та інше. Девін використовує алгоритми машинного навчання, щоб постійно навчатися та покращувати свою продуктивність, адаптуючись до нових викликів, які виникають. Простими словами, Девін може конструювати та впроваджувати додатки з нуля до кінця, а також може навчати та вдосконалювати свої власні AI-моделі.
Девін здатний планувати та виконувати складні інженерні завдання, які зазвичай включають тисячі рішень. Ця здатність стала можливою завдяки досягненням Cognition у довгостроковому мисленні та плануванні. Згідно з інформацією компанії, Девін може отримувати відповідний контекст на кожному етапі, навчатися автономно з часом та виправляти помилки за потреби.
На бенчмарку SWE-Bench (, бенчмарку для оцінювання великих мовних моделей на реальних програмних питаннях, що знаходяться на GitHub), Девін правильно вирішив 13,86 відсотка питань без жодної допомоги, порівняно з 1,96 відсотка без допомоги та 4,80 відсотка з допомогою попередньої держави-найкращої моделі.
Хоча компанія детально описала можливості Девіна, деякі експерти висловлюють занепокоєння, що програміст-штучний інтелект може зіткнутися з труднощами у випадках із складними вимогами або сценаріями, які залежать від людської інтуїції та креативності. Крім того, інструменти штучного інтелекту, такі як Девін, викликають побоювання щодо можливого вивільнення робочих місць.
Проте деякі особи вважають, що Девін міг би стати цінним партнером для численних програмістів, відкриваючи нові можливості для співпраці між людською творчістю та ШІ.
Слідкуйте за нами в Twitter для останніх публікацій та оновлень