Трехмерная сверточная нейросеть распознала движения животных с большой точностью

Группа
ученых из
США представила нейросетевой алгоритм,
позволяющий
по видео с
животными
восстанавливать их трехмерную позу с
высокой точностью. В отличие от большинства современных подходов, этот метод не требует прикрепления маркеров к животным, а значит он будет удобен для наблюдений за животными не только в лабораториях, но и в естественной среде. Результаты
исследования были опубликованы в Nature.

Изучение движения животных занимает
центральное место в этологии, нейробиологии,
психологии и экологии. Однако
до сих пор не существует универсального
метода,
воспроизводимого
в лабораториях и
устойчивого в естественной среде
обитания, который
бы не использовал
прикрепление
маркеров к животным.

Изучение движений животных ранее уже автоматизировали с помощью
двумерных методов — например, нейросети помогали отслеживать двумерные координаты частей тела. Хотя эти 2D-прогнозы и могут быть
триангулированы в 3D с
использованием
нескольких независимых изображений,
такой
подход неэффективен для
изучения свободно движущихся зверей.
Происходит это потому, что сама нейросеть не знает ничего о трехмерной позе
и не может объединять информацию с
разных изображений. Если с одного из ракурсов часть тела будет перекрыта посторонним предметом, положение анатомических ориентиров определится неточно. У использования двумерных методов есть еще один недостаток: ничего не гарантирует хороший результат
для
любых
поз животных и углов
обзора
камеры.

Для борьбы с таким и проблемами придумали оптимизационные схемы, которые используются для уточнения или отбрасывания неточно определенных координат. Но они пока не способны надежно отслеживать свободно движущихся
животных, за исключением случаев обучения
с большим количеством кадров.

Для
изучения движения животных группа под
руководством Тимоти Данна (Timothy Dunn) из
Дьюкского университета и
Джесси Маршалла (Jesse Marshall) из
Гарвардского
университета разработала сверточную нейросеть
DANNCE. Ключевым нововведением DANNCE по
сравнению с предыдущими алгоритмами
является то, что сеть полностью трехмерна,
так что она может узнавать об особенностях 3D-изображения и о том, как
камеры и ориентиры связаны друг с другом
в пространстве. Чтобы
обучить нейросеть, ученые собрали датасет из семи миллионов кадров синхронизированного видео и меток с анатомическими ориентирами грызунов с нескольких ракурсов. Обученная нейросеть предсказывала положение ориентиров животных, используя только видео.

Работу DANNCE можно описать следующим образом. В каждый момент видеозаписи при помощи
триангуляции изображений определяется положение крысы в пространстве.
Этому пространственному положению ставится в соответствие пустая
3D-сетка. Далее на каждое из изображений проецируется один воксель.
Пиксели из областей изображения, на которых есть грызун,
трансформируются в воксель. Затем нейросеть обрабатывает данные со всех
вокселей и выдает предполагаемые положения анатомических ориентиров
животного на исходной 3D-сетке.

Исследователи сравнили работу DANNCE с DeepLabCut (DLC) — современным алгоритмом на основе двумерных сверточных нейросетей. Для этого оба метода обучили на одном и том же наборе видеокадров и поз (180 456 уникальных кадров, 3609 120 маркеров) и протестировали их на новых изображениях объекта, который не участвовал в обучении. Тестовая выборка состояла из 2400 кадров, которые были разделены на 12 групп в зависимости от поведения грызуна. Выяснилось, что DANNCE превосходит DLC даже в тех случаях, когда первый алгоритм получает изображения с трех камер, а второй — с шести: в этом случае неопределенность координат, предсказанных DANNCE, была более чем в 10 раз меньше. К тому же, если уменьшать число камер, DLC становилось труднее следить за большим числом ориентиров, в то время как DANNCE все так же хорошо справлялась с задачей. Кроме того, DANNCE научилась отслеживать положения мышей, мартышек и синиц, когда в обучающую выборку добавили небольшое количество вручную размеченных данных.

Успешное применение нейросетей в работе с изображениями и видео не ограничивается этой работой. Ранее мы рассказывали, как нейросеть превратила растовое изображение в непрерывное.

Яна Савченко

Источник: nplus1.ru

голос

Рейтинг статьи

. .

Источник
Автор: Андрей Зверев

Трехмерная сверточная нейросеть распознала движения животных с большой точностью

Автор:beron

Похожие записи

Автор: beron

20 мая 1631 года — Магдебургская трагедия: одна из самых жестоких резней Тридцатилетней войны

Либеральная стратегия пространственного развития страны

7 декабря 1941 года ознаменовался атакой на Пёрл-Харбор

You missed

20 мая 1631 года — Магдебургская трагедия: одна из самых жестоких резней Тридцатилетней войны

9 октября 1807 года: поворотный момент в аграрной истории Пруссии отмена личной зависимости крестьян

Опиумные войны: причины, последствия

Иран отбил свой танкер, ранее захваченный США

Трехмерная сверточная нейросеть распознала движения животных с большой точностью

Автор:beron

Похожие записи

Автор: beron

Похожая запись

20 мая 1631 года — Магдебургская трагедия: одна из самых жестоких резней Тридцатилетней войны

Либеральная стратегия пространственного развития страны

7 декабря 1941 года ознаменовался атакой на Пёрл-Харбор

You missed

20 мая 1631 года — Магдебургская трагедия: одна из самых жестоких резней Тридцатилетней войны

9 октября 1807 года: поворотный момент в аграрной истории Пруссии отмена личной зависимости крестьян

Опиумные войны: причины, последствия

Иран отбил свой танкер, ранее захваченный США