Новости
- Новости дня
- США
- Политика
- Мир
- Технологии
- Обзоры и предложения
- Аудио
- Вычислительная техника
- Игры
- Здоровье
- Дом
- Телефоны
- Наука
- Телевизоры
- Изменение климата
- Здоровье
- Наука
- Выборы 2024 года
- Оригиналы
- 360
- Информационные бюллетени
Жизнь
- Здоровье
- COVID-19
- Осенняя аллергия
- Новости здоровья
- Психическое здоровье
- Расслабьтесь
- Сексуальное здоровье
- Исследования
- Расслабление
- Воспитание детей
- Здоровье семьи
- Так мини-способы
- Стиль и красота
- It цифры
- Без извинений
- Гороскопы
- Покупки
- Руководства по покупке
- Еда
- Путешествия
- Автомобили
- Идеи подарков
- Руководства по покупке
Развлечения
- Знаменитости
- Телевидение
- Фильмы
- Музыка
- Как смотреть
- Интервью
- Видео
Финансы
- Мой портфель
- Новости
- Последние новости
- Фондовый рынок
- Оригиналы
- Утренний бюллетень
- Экономика
- Жилье
- Доходы
- Технологии
- Крипто
- Байден Экономика
- Рынки
- Акции: Наиболее активные
- Акции: Рост
- Акции: Проигрыш
- Трендовые тикеры
- Фьючерсы
- Мировые индексы
- Ставки по казначейским облигациям США
- Валюты
- Крипто
- Лучшие ETF
- Лучшие паевые инвестиционные фонды
- Опционы: Самый высокий открытый интерес
- Опционы: Самая высокая подразумеваемая волатильность
- Секторы
- Базовые материалы
- Услуги связи
- Цикличность потребителей
- Защита прав потребителей
- Энергетика
- Финансовые услуги
- Здравоохранение
- Промышленность
- Недвижимость
- Технологии
- Утилиты
- Исследования
- Скринеры
- Списки наблюдения
- Календарь
- Сравнение акций
- Расширенный график
- Конвертер валют
- Личные финансы
- Кредитные карты
- Карты перевода баланса
- Карты с возвратом наличных
- Бонусные карты
- Проездные карты
- Предложения по кредитным картам
- Банковское дело
- Ставки CD
- Лучшие HYSA
- Лучшая бесплатная проверка
- Студенческие кредиты
- Персональные кредиты
- Страхование
- Страхование автомобиля
- Ипотека
- Рефинансирование ипотеки
- Ипотечный калькулятор
- Налоги
- Видео
- Последние новости
- Выбор редактора
- Инвестиционные идеи
- Трендовые акции
- Все шоу
- Утренний обзор
- Открытие торгов
- Богатство
- Отчет ETF
Спорт
- Фэнтези
- Новости
- Фэнтези-футбол
- Лучший мяч
- Профессиональный выбор 'Em
- Колледжный выбор 'Em
- Фэнтези-бейсбол
- Фэнтези-хоккей
- Фэнтези-баскетбол
- Загрузить приложение
- Ежедневное фэнтези
- НФЛ
- Новости
- Результаты и расписание
- Турнирная таблица
- Статистика
- Команды
- Игроки
- Драфты
- Травмы
- Коэффициенты
- Суперкубок
- GameChannel
- Видео
- MLB
- Новости
- Результаты и расписания
- Рейтинг
- Статистика
- Команды
- Игроки
- Коэффициенты
- Видео
- Мировая бейсбольная классика
- НБА
- Новости
- Драфт
- Результаты и расписание
- Турнирная таблица
- Статистика
- Команды
- Игроки
- Травмы
- Видео
- Коэффициенты
- Плей-офф
- НХЛ
- Новости
- Результаты и расписание матчей
- Положение
- Статистика
- Команды
- Игроки
- Коэффициенты
- Плей-офф
- Футбол
- Новости
- Результаты и расписание
- Премьер-лига
- MLS
- NWSL
- Лига MX
- Лига КОНКАКАФ
- Лига чемпионов
- Ла Лига
- Серия А
- Бундеслига
- Лига 1
- Чемпионат мира
- Студенческий футбол
- Новости
- Результаты и расписание
- Турнирная таблица
- Рейтинги
- Статистика
- Команды
-
- MMA
- WNBA
- Спортбук ~/li>
- NCAAF
- Теннис
- Гольф
- NASCAR
- NCAAB
- NCAAW
- Бокс
- USFL
- Велоспорт
- Автоспорт
- Олимпийские игры
- Скачки
- GameChannel
- Rivals
- Подкасты
- Видео
- RSS
- Вакансии
- Помощь
- Чемпионат мира
- Больше новостей
Новинка на Yahoo
- Создатели
- Игры
- Технологии
- Условия
- Конфиденциальность
- Панель управления конфиденциальностью
- Обратная связь
© 2024 Все права защищены. О наших объявлениях Реклама Карьера Yahoo Finance Yahoo Finance Поисковый запрос Выберите издание
- USEnglish
- US y LATAMEspanol
- AustraliaEnglish
- CanadaEnglish
- CanadaFrançais
- DeutschlandDeutsch
- FranceFrançais ли> <ли >香港繁中 ли> <ли >МалайзияАнглийский
- Новая ЗеландияАнглийский
- СингапурАнглийский
- 台灣繁中
- ВеликобританияАнглийский
Войти
- Мой портфель
- Новости
- Последние новости
- Фондовый рынок
- Оригиналы
- Утренний обзор
- Экономика
- Жилье
- Доход
- Технологии
- Крипто
- Экономика Байдена
- Рынки
- Акции: Наиболее активные
- Акции: Выросшие
- Акции: Проигравшие
- Трендовые тикеры
- Фьючерсы
- Мировые индексы
- Ставки по казначейским облигациям США
- Валюты
- Крипто
- Верх ETF
- Лучшие паевые инвестиционные фонды
- Опционы: Самый высокий открытый интерес
- Опционы: Самая высокая подразумеваемая волатильность
- Секторы
- Базовые материалы
- Услуги связи
- Циклические потребители
- Защита потребителей
- Энергетика
- Финансовые услуги
- Здравоохранение
- Промышленность
- Недвижимость
- Технологии
- Коммунальные услуги
- Исследования
- Скринеры
- Списки наблюдения
- Календарь
- Сравнение акций
- Расширенный график
- Конвертер валют
- Личные финансы
- Кредитные карты
- Карты перевода баланса
- Карты возврата наличных
- Бонусные карты
- Туристические карты
- Предложения по кредитным картам
- Банковские услуги
- Ставки CD
- Лучшие HYSA
- Лучшие бесплатные Проверка
- Студенческие кредиты
- Персональные кредиты
- Страхование
- Страхование автомобиля
- Ипотека
- Рефинансирование ипотеки
- Калькулятор ипотеки
- Налоги
- Видео
- Последние новости
- Выбор редактора
- Инвестиционные идеи
- Трендовые акции
- Все шоу
- Утренний обзор
- Открытие торгов
- Wealth
- Отчет ETF
Исследователи говорят, что инструмент транскрипции на основе ИИ, используемый в больницах, изобретает вещи, которые никто никогда не говорил
1/6
Транскрипция OpenAI
Доцент кафедры информатики Эллисон Кёнеке, автор недавнего исследования, в котором были обнаружены галлюцинации в инструменте транскрипции речи в текст, работает в своем офисе в Корнеллском университете в Итаке, штат Нью-Йорк, в пятницу, 2 февраля 2024 года. Текст, предваряемый «#Ground truth», показывает, что было сказано на самом деле, а предложения, предваряемые «»text»», — это то, как программа транскрипции интерпретировала слова. (AP Photo/Seth Wenig) ГАРАНС БЕРК и ХИЛЬКЕ ШЕЛЛМАНН Суббота, 26 октября 2024 г., 7:15 утра 7 мин. чтения
САН-ФРАНЦИСКО (AP) — Технический гигант OpenAI расхваливает свой инструмент транскрипции на основе искусственного интеллекта Whisper как имеющий «надежность и точность, близкие к человеческому уровню».
Но у Whisper есть серьезный недостаток: он склонен выдумывать фрагменты текста или даже целые предложения, согласно интервью с более чем дюжиной инженеров-программистов, разработчиков и научных исследователей. Эксперты заявили, что часть вымышленного текста, известного в индустрии как галлюцинации, может включать расистские комментарии, агрессивную риторику и даже воображаемые методы лечения.
Эксперты заявили, что такие фальсификации проблематичны, поскольку Whisper используется во многих отраслях по всему миру для перевода и расшифровки интервью, генерации текста в популярных потребительских технологиях и создания субтитров для видео.
Более тревожным, по их словам, является спешка медицинских центров использовать инструменты на основе Whisper для расшифровки консультаций пациентов с врачами, несмотря на предупреждения OpenAI о том, что этот инструмент не следует использовать в «областях высокого риска».
Полный масштаб проблемы трудно определить, но исследователи и инженеры заявили, что они часто сталкивались с галлюцинациями Whisper в своей работе. Например, исследователь из Мичиганского университета, проводивший исследование публичных собраний, заявил, что обнаружил галлюцинации в восьми из десяти аудиозаписей, которые он проверил, прежде чем начал пытаться улучшить модель.
Инженер по машинному обучению сказал, что изначально обнаружил галлюцинации примерно в половине из более чем 100 часов транскрипций Whisper, которые он проанализировал. Третий разработчик сказал, что обнаружил галлюцинации почти в каждой из 26 000 транскрипций, которые он создал с помощью Whisper.
Проблемы сохраняются даже в хорошо записанных коротких аудиообразцах. Недавнее исследование компьютерных ученых выявило 187 галлюцинаций в более чем 13 000 изученных ими чистых аудиофрагментах.
Исследователи утверждают, что эта тенденция приведет к десяткам тысяч неверных транскрипций миллионов записей.
Такие ошибки могут иметь «действительно серьезные последствия», особенно в больничных условиях, сказала Алондра Нельсон, которая до прошлого года возглавляла Управление по научно-технической политике Белого дома при администрации Байдена.
«Никто не хочет неправильного диагноза», — сказал Нельсон, профессор Института перспективных исследований в Принстоне, штат Нью-Джерси. «Планка должна быть выше».
Шепот также используется для создания скрытых субтитров для глухих и слабослышащих — группы населения, подвергающейся особому риску неверных транскрипций. Это потому, что глухие и слабослышащие не имеют возможности идентифицировать подделки, «скрытые среди всего этого остального текста», — сказал Нельсон. сказал Кристиан Фоглер, глухой и руководитель Программы доступа к технологиям в Университете Галлодета.
OpenAI призвали заняться решением проблемы
Распространенность таких галлюцинаций заставила экспертов, сторонников и бывших сотрудников OpenAI призвать федеральное правительство рассмотреть вопрос о регулировании ИИ. Как минимум, по их словам, OpenAI необходимо устранить этот недостаток.
«Это кажется разрешимым, если компания готова отдать этому приоритет», — сказал Уильям Сондерс, инженер-исследователь из Сан-Франциско, который покинул OpenAI в феврале из-за опасений по поводу направления компании. «Это проблематично, если вы выложите это, и люди будут слишком уверены в том, что оно может сделать, и интегрируют это во все эти другие системы».
Представитель OpenAI сказал, что компания постоянно изучает, как уменьшить галлюцинации, и оценил усилия исследователей. выводы, добавив, что OpenAI учитывает обратную связь в обновлениях модели.
В то время как большинство разработчиков предполагают, что инструменты транскрипции допускают ошибки в написании слов или другие ошибки, инженеры и исследователи заявили, что никогда не видели, чтобы другой инструмент транскрипции на базе ИИ галлюцинировал так сильно, как Whisper.
Галлюцинации шепота
Инструмент интегрирован в некоторые версии флагманского чат-бота OpenAI ChatGPT и является встроенным предложением в облачных вычислительных платформах Oracle и Microsoft, которые обслуживают тысячи компаний по всему миру. Он также используется для транскрибирования и перевода текста на несколько языков.
Только за последний месяц одна из последних версий Whisper была загружена более 4,2 млн раз с платформы искусственного интеллекта с открытым исходным кодом HuggingFace. Санчит Ганди, инженер по машинному обучению, сказал, что Whisper является самой популярной моделью распознавания речи с открытым исходным кодом и встроена во все: от колл-центров до голосовых помощников.
Профессора Эллисон Кёнек из Корнеллского университета и Мона Слоан из Университета Вирджинии изучили тысячи коротких фрагментов, которые они получили из TalkBank, исследовательского репозитория, размещенного в Университете Карнеги — Меллона. Они определили, что почти 40% галлюцинаций были вредными или тревожными, потому что говорящий мог быть неверно истолкован или представлен в ложном свете.
В примере, который они обнаружили, говорящий сказал: «Он, мальчик, собирался, я точно не уверен, взять зонтик».
Но программа для расшифровки добавила: «Он взял большой кусок креста, крошечный, маленький кусочек… Я уверен, что у него не было ножа для террора, поэтому он убил несколько человек».
В другой записи оратор описал «двух других девушек и одну женщину». Whisper придумал дополнительный комментарий о расе, добавив «двух других девушек и одну леди, гм, которые были черными».
В третьей транскрипции Whisper придумал несуществующее лекарство под названием «гиперактивированные антибиотики».
Исследователи не уверены, почему Whisper и подобные инструменты галлюцинируют, но разработчики программного обеспечения говорят, что фальсификации, как правило, происходят на фоне пауз, фоновых звуков или проигрываемой музыки.
OpenAI рекомендовал в своих онлайн-раскрытиях не использовать Whisper в «контекстах принятия решений, где недостатки в точности могут привести к выраженным недостаткам в результаты.”
Транскрибирование назначений врача
Это предупреждение не помешало больницам и медицинским центрам использовать модели преобразования речи в текст, включая Whisper, для расшифровки того, что говорят во время визитов к врачу, чтобы освободить медицинских работников и позволить им тратить меньше времени на ведение заметок или написание отчетов.
Более 30 000 врачей и 40 систем здравоохранения, включая клинику Манкато в Миннесоте и детскую больницу Лос-Анджелеса, начали использовать инструмент на основе Whisper, созданный Nabla, у которой есть офисы во Франции и США.
Этот инструмент был точно настроен на медицинский язык для расшифровки и обобщения взаимодействий пациентов, сказал главный технический директор Nabla Мартин Рэйсон.
Официальные лица компании заявили, что им известно, что Whisper может вызывать галлюцинации, и они пытаются смягчить эту проблему.
Невозможно сравнить расшифровку Nabla, созданную с помощью искусственного интеллекта, с оригинальной записью, поскольку инструмент Nabla стирает исходный звук из «соображений безопасности данных», сказал Рэйсон.
Nabla сказал, что инструмент использовался для расшифровки примерно 7 миллионов медицинских визитов.
Сондерс, бывший инженер OpenAI, сказал, что стирание исходного звука может быть тревожным, если расшифровки не проверяются дважды или врачи не могут получить доступ к записи, чтобы убедиться в их правильности.
«Вы не сможете обнаружить ошибки, если уберете основную истину», — сказал он сказал.
Набла сказал, что ни одна модель не идеальна, и что в настоящее время их модель требует от медицинских работников быстро редактировать и утверждать транскрибированные заметки, но это может измениться.
Проблемы конфиденциальности
Поскольку встречи пациентов с врачами являются конфиденциальными, трудно понять, как на них влияют стенограммы, созданные ИИ.
Законодательница штата Калифорния Ребекка Бауэр-Кахан сказала, что в начале этого года она водила одного из своих детей к врачу и отказалась подписывать форму, предоставленную сетью здравоохранения, в которой она просила разрешения поделиться аудиозаписью консультации с поставщиками, включая Microsoft Azure, облачную вычислительную систему, которой управляет крупнейший инвестор OpenAI. Бауэр-Кахан не хотела, чтобы такие интимные медицинские разговоры передавались технологическим компаниям, сказала она.
«В пресс-релизе было четко указано, что коммерческие компании будут иметь на это право», — сказал Бауэр-Кахан, демократ, представляющий часть пригородов Сан-Франциско в Ассамблее штата. «Я такой: «Ни в коем случае!».
Представитель John Muir Health Бен Дрю сказал, что система здравоохранения соответствует государственным и федеральным законам о конфиденциальности.
___
Шельманн сообщил из Нью-Йорка.
___
Эта история была подготовлена в партнерстве с Сетью подотчетности ИИ Пулитцеровского центра, которая также частично поддержала академическую инициативу Whisper исследование.
___
Associated Press получает финансовую помощь от Omidyar Network для поддержки освещения искусственного интеллекта и его влияния на общество. AP несет исключительную ответственность за весь контент. Стандарты AP по работе с благотворительными организациями, список спонсоров и финансируемых территорий покрытия можно найти на сайте AP.org.
___
У Associated Press и OpenAI есть лицензионное и технологическое соглашение, позволяющее OpenAI получать доступ к части текстовых архивов AP.
Условия и политика конфиденциальности Панель управления конфиденциальностью