Искусственный интеллект, нейросети

183,496 1,093
 

Фильтр
TAU
 
Слушатель
Карма: +53.61
Регистрация: 24.07.2008
Сообщений: 4,235
Читатели: 0
Цитата: GeorgV от 23.11.2024 23:41:32Камрады - есть потребность в нейронке, преобразующую текст в речь на русский для озвучки роликов. Проект экспериментальный, некоммерческий, платная подписка на сервис конверсии не интересен. Длина роликов/голоса до 5 минут. 

Спасибо за предложения.

Natural Reader — это инструмент на базе искусственного интеллекта, предназначенный для преобразования текста в аудиоформат. Программа поддерживает преобразование текстов, PDF-файлов и других документов в звуковую озвучку, позволяя слушать книги, учебные материалы или деловые документы где угодно и в любое время.

📍Для бизнеса сервис предлагает функционал, позволяющий создавать профессиональное озвучивание, добавлять эмоции и звуковые эффекты для придания речи реалистичности.

🔴 Среди ключевых возможностей:

▫️Совместимость с PDF-файлами
▫️Создание аудио озвучки
▫️ Гибкая настройка скорости чтения
▫️ Преобразование текста в MP3
▫️ Веб-версия, мобильное приложение, расширение для Chrome
▫️ Естественное звучание голосов

NaturalReader сочетает простоту использования с надежностью, что делает его подходящим для самых разных задач.
  • +0.08 / 4
  • АУ
GeorgV
 
canada
Слушатель
Карма: +38.85
Регистрация: 14.05.2010
Сообщений: 18,247
Читатели: 7
Цитата: GeorgV от 23.11.2024 23:41:32Камрады - есть потребность в нейронке, преобразующую текст в речь на русский для озвучки роликов. Проект экспериментальный, некоммерческий, платная подписка на сервис конверсии не интересен. Длина роликов/голоса до 5 минут. 

Спасибо за предложения.


Покопался, и нашел вот этот сервис: 

luvvoice.com

Пока, удовлетворяет. Всем спасибо!
Дисциплина важна, чтобы добиться успеха, но одной дисциплины недостаточно. Нужна внутренняя мотивация для достижения цели. И конечно, трудолюбие. Это талант заставить себя работать и уметь это делать продуктивно. (ВВП)
  • +0.02 / 1
  • АУ
Вадим Р.
 
russia
Хабаровск
60 лет
Слушатель
Карма: +196.52
Регистрация: 04.04.2012
Сообщений: 7,217
Читатели: 5
Цитата: Lh2024 от 09.11.2024 00:10:14...
В принципе надо правильно  делать запрос и всё получиться. Главное не надо через запятую, а через "и".

Не так всё просто с этим Шедеврумом от Яндекса. Видимо, фототеку они купили у нашего вероятного противника, поэтому он тупо не понимает многого из наших привычных терминов и образов. На запрос "Дед Мороз" рисует Санта Клауса, на "Винни Пух" рисует жёлтого недоделанного американского же. Не знает, что такое нормальные валенки и рукавицы. На запрос "Мамочка" несколько раз упрямо рисовал мне негритянских девочек, пока мне это не надоело...
Опять же, странные этические нормы: рисовать разлагающиеся ходячие трупы - в порядке вещей, а вот красивую обнажённую женскую натуру - низзя... А когда, применив всякие замысловатые формулировки, удаётся нарисовать дамочку, радующую глаз, то тут же немедленно удаляют этот шедевр.
P.S. Решил ещё разок попробовать - ничего не изменилось, значит, это не случайность. Итак, "Мамочка"!
Отредактировано: Вадим Р. - 26 ноя 2024 10:59:51
  • +0.12 / 7
  • АУ
small__virus
 
russia
Сочи
Слушатель
Карма: +37.38
Регистрация: 04.04.2013
Сообщений: 2,202
Читатели: 5
****
Новость   819 0
Цитата: Телеграм-канал КиберХаб - IT и Нейросети🎬 Наглядный пример того, на что способны лучшие видеогенераторы на сегодняшний день.

Чтобы сравнение было честным, для оживления изображения использован один и тот же промпт:
She's walking through a garden holding a sword. Light breeze

КиберХаб | БотGPT

https://t.me/kyberhub/3399

Дискогрыз полиморфный обыкновенный, редчайшей породы гад, падла зеленая...
  • +0.04 / 3
  • АУ
Lh2024
 
Слушатель
Карма: +0.13
Регистрация: 08.11.2024
Сообщений: 40
Читатели: 0
Цитата: Вадим Р. от 25.11.2024 10:25:02Не так всё просто с этим Шедеврумом от Яндекса. Видимо, фототеку они купили у нашего вероятного противника, поэтому он тупо не понимает многого из наших привычных терминов и образов. На запрос "Дед Мороз" рисует Санта Клауса, на "Винни Пух" рисует жёлтого недоделанного американского же. Не знает, что такое нормальные валенки и рукавицы. На запрос "Мамочка" несколько раз упрямо рисовал мне негритянских девочек, пока мне это не надоело...
Опять же, странные этические нормы: рисовать разлагающиеся ходячие трупы - в порядке вещей, а вот красивую обнажённую женскую натуру - низзя... А когда, применив всякие замысловатые формулировки, удаётся нарисовать дамочку, радующую глаз, то тут же немедленно удаляют этот шедевр.



Ваша правда.
ЦитатаВадим Р. от 25.11.2024 11:25:02  Видимо, фототеку они купили 

Создала запрос на "Золото и Летучая мышь". и вот, что мне Шедеврум-Нейросеть выдала. 



Это же Бэтман в золом доспехе на фоне жёлтого пано. 

Дальше запрос отправила. "Летучая мышь". 

И вот результат. 



Получается - это набор картинок. Готовые картинки. Если запрос выходит за рамки готовых картинок, то Нейросеть их выполнить не готова и сообщает об ошибке.
Отредактировано: Lh2024 - 28 ноя 2024 16:20:42
Когда-то я сделал одно очень важное приобретение — собственное мнение.(с)
  • +0.05 / 2
  • АУ
Lh2024
 
Слушатель
Карма: +0.13
Регистрация: 08.11.2024
Сообщений: 40
Читатели: 0
нейросети.
Дискуссия   411 1
Создала сегодня картинку в нейросети.
Белая летучая мышь и золотые горы и водопад. 
Золотые горы получается - это жёлтая листва на деревьях и некие бесхозные крылья жёлтого цвета. Может быть это гардероб летучей мыши, сегодня у неё белые крылья, а завтра она наденет жёлтые? Так думает нейросеть? 

Отредактировано: Lh2024 - 02 дек 2024 16:33:40
Когда-то я сделал одно очень важное приобретение — собственное мнение.(с)
  • +0.00 / 0
  • АУ
rommel.lst
 
russia
Луганск/Томск
Слушатель
Карма: +88.64
Регистрация: 20.06.2008
Сообщений: 13,325
Читатели: 8
Цитата: Lh2024 от 02.12.2024 16:32:17Создала сегодня картинку в нейросети.
Белая летучая мышь и золотые горы и водопад. 
Золотые горы получается - это жёлтая листва на деревьях и некие бесхозные крылья жёлтого цвета. Может быть это гардероб летучей мыши, сегодня у неё белые крылья, а завтра она наденет жёлтые? Так думает нейросеть? 



Попробуйте сформулировать запрос на английском.
Когда не знаешь, что делать, -
делай шаг вперед..
  • +0.03 / 2
  • АУ
rommel.lst
 
russia
Луганск/Томск
Слушатель
Карма: +88.64
Регистрация: 20.06.2008
Сообщений: 13,325
Читатели: 8
Цитата: small__virus от 13.11.2024 07:45:37Может, кому надо...
Цитата: Телеграм-канал Не баг, а фичаЛУЧШАЯ нейронка для кодинга уже в сети! Qwen2.5-Coder-32B-Instruct вышла в релиз и активно забирает лавры даже у ChatGPT-4о — модель выложили в открытый доступ и она БЕСПЛАТНО доступна ВСЕМ!





Попробовал у них сгенерить код, но оно выдает его в час по чайной ложке - форма вывода ограничена по длине текста слишком сильно. ИМХО, пока это говно.

Попробовал также запросить у русской версии чатгопоты пример кода для STM32 в среде ардуино. Оно выдало привычную лажу, но я попросил исправить код с учетом того, что мне нужна максимальная скорость. И, вуаля, гопота поднатужившись выдала мне внешне пригодный код на уровне прямого оперирования с регистрами процессора... Могёт!
Отредактировано: rommel.lst - 03 дек 2024 08:36:37
Когда не знаешь, что делать, -
делай шаг вперед..
  • +0.05 / 3
  • АУ
small__virus
 
russia
Сочи
Слушатель
Карма: +37.38
Регистрация: 04.04.2013
Сообщений: 2,202
Читатели: 5
Цитата: Lh2024 от 28.11.2024 16:17:59 Получается - это набор картинок. Готовые картинки.
Увы, немножко не так.
Я уже писал, нейросети немного не так работают. Вкратце.
Это для нейросетей генеративного типа.
Сначала нейросеть учат распознавать объекты.
Следующий этап, картинки, намеренно портят. Заставляя нейросеть восстанавливать изображения. Естественно, корректируя модель.
И так, вплоть до шума.
Строго говоря, сама генерация картинки происходит так.
Генерируется шум. А промт - это подсказка, что, грубо говоря, восстанавливать изображением.
Нет, нейросеть не содержит в себе картинок напрямую. Она содержит в себе, ну, скажем, образы. Которые имеют тот или определенный вес при генерации.
Причем, для расширения возможностей, нейросеть может скрыто дополнять промт. Например, генерируя ту же летучую мышь на фоне гор, на фоне озера, в лесу или на речке.

Это утрированно и поверхностно. Но для понимания хватит.

А корни у всего этого растут из распознавания текста.
Дискогрыз полиморфный обыкновенный, редчайшей породы гад, падла зеленая...
  • +0.02 / 2
  • АУ
Поверонов
 
Слушатель
Карма: +38.79
Регистрация: 05.06.2010
Сообщений: 20,051
Читатели: 8
Цитата: small__virus от 03.12.2024 10:21:37Увы, немножко не так.
Я уже писал, нейросети немного не так работают. Вкратце.
Это для нейросетей генеративного типа.
Сначала нейросеть учат распознавать объекты.
Следующий этап, картинки, намеренно портят. Заставляя нейросеть восстанавливать изображения. Естественно, корректируя модель.
И так, вплоть до шума.
Строго говоря, сама генерация картинки происходит так.
Генерируется шум. А промт - это подсказка, что, грубо говоря, восстанавливать изображением.
Нет, нейросеть не содержит в себе картинок напрямую. Она содержит в себе, ну, скажем, образы. Которые имеют тот или определенный вес при генерации.
Причем, для расширения возможностей, нейросеть может скрыто дополнять промт. Например, генерируя ту же летучую мышь на фоне гор, на фоне озера, в лесу или на речке.

Это утрированно и поверхностно. Но для понимания хватит.

А корни у всего этого растут из распознавания текста.

для слепых в html ввели атрибут alt представляющий собой текстовое описание изображения. Google штрафует сайты пренебрегающие такими описаниями принуждая вебмастеров к описанию всех используемых картинок. Таким образом в интернете накопились миллиарды картинок с их описаниями. Этот массив и используется ИИ для генерации картинок по словесному описанию
  • +0.07 / 4
  • АУ
baldprice
 
Слушатель
Карма: +4.65
Регистрация: 28.11.2009
Сообщений: 833
Читатели: 0
Цитата: Поверонов от 03.12.2024 11:42:32для слепых в html ввели атрибут alt представляющий собой текстовое описание изображения. Google штрафует сайты пренебрегающие такими описаниями принуждая вебмастеров к описанию всех используемых картинок. Таким образом в интернете накопились миллиарды картинок с их описаниями. Этот массив и используется ИИ для генерации картинок по словесному описанию


Искусственный интеллект (ИИ) - в законодательном понимании  - ноу-хау, служебное произведение, база данных, топология интегральных схем, программа для ЭВМ...и другие понятия изложенные в ГК (часть 4)


Технология с искусственным  интеллектом (ИИ) – цифровая технология, которая включает алгоритм функционирования, математические процедуры (математический код) и программный продукт.


В таком  виде Технология с искусственным  интеллектом (ИИ) внедрена и внедряется в российское производство с результатом кратно превышающем зарубежные аналоги....Примеров - много - технические результаты - смотрим и слушаем наши СМИ...
БОЕВЫЕ ФУНКЦИИ ДЕНЕГ И ЭНЕРГОТЕХНОЛОГИЧЕСКАЯ ЦЕНА НЕФТИ - стратегия по принуждению землян к взаимопониманию без кровавых войн.
БОЕВЫЕ ФИНАНСОВЫЕ доктрина,стратегия, тактика и оборона, разведданные, боеготовность, мониторинг и средства доставки оружия.
  • -0.08 / 3
  • АУ
small__virus
 
russia
Сочи
Слушатель
Карма: +37.38
Регистрация: 04.04.2013
Сообщений: 2,202
Читатели: 5
Цитата: Поверонов от 03.12.2024 11:42:32для слепых в html ввели атрибут alt представляющий собой текстовое описание изображения. Google штрафует сайты пренебрегающие такими описаниями принуждая вебмастеров к описанию всех используемых картинок. Таким образом в интернете накопились миллиарды картинок с их описаниями. Этот массив и используется ИИ для генерации картинок по словесному описанию


Это да. Но я не про это.
Я про изначальное. Откуда все пошло.
Изначально родились программы про распознаванию текста. Примитивное.
Затем продвинутое. Затем научились восстанавливать. И только потом замахнулись на картинки.
Строго говоря, нейросети с генерацией картинок массово появились только года два назад.
Да, были и ранние, но они были хуже качеством и платные.
Не мало к этому приложила руку NVIDIA, начав выпускать платформы с большим объемом памяти. Которые не игровые, а профессиональные.
Именно на них тренировали и создавали модели для первых продакшен-продуктов с генерацией.картинок.
Дискогрыз полиморфный обыкновенный, редчайшей породы гад, падла зеленая...
  • +0.02 / 2
  • АУ
Zkvxz
 
russia
Южный Урал
Слушатель
Карма: +54.45
Регистрация: 14.02.2017
Сообщений: 1,076
Читатели: 3
Пока технологические гиганты соревнуются в разработке все более продвинутых моделей, исследователи из Университета Пенсильвании обнаружили серьезную проблему безопасности: любого робота под управлением LLM можно взломать со 100% гарантией. Их алгоритм RoboPAIR научился обходить все защитные механизмы за считаные дни.
Принцип работы RoboPAIR элегантен в своей простоте: одна языковая модель генерирует промпты для взлома другой. «Атакующая» модель анализирует ответы цели и корректирует свои запросы, пока не найдет способ обойти фильтры безопасности. Для успешной атаки алгоритму нужен только API целевого робота, чтобы формировать команды в исполняемом виде. Дополнительная «модель-судья» проверяет, что сгенерированные команды физически выполнимы с учетом ограничений окружающей среды.
Исследователи протестировали RoboPAIR на трех системах разной степени закрытости: робопсе Go2 (полностью закрытая система), роботе Clearpath Robotics Jackal (частично открытый код) и симуляторе беспилотного автомобиля от Nvidia (открытый исходный код). Во всех случаях алгоритм добился успеха, причем взломанные системы не просто выполняли вредоносные команды, но и сами начинали предлагать опасные варианты действий.
Полное исследование можно прочитать тут, а видеодемонстрация доступна по этой ссылке.
Честно попёрто с Хабра
Будет али нет, а ты паши да сей. В лучшее верить надо!
  • +0.14 / 7
  • АУ
small__virus
 
russia
Сочи
Слушатель
Карма: +37.38
Регистрация: 04.04.2013
Сообщений: 2,202
Читатели: 5
****
Новость   846 5
Цитата: Телеграм-канал КиберХаб - IT и Нейросети👏 Смотрите, на что способен тандем из двух нейросетей.

Сначала в Midjourney cгенерировали изображение (внизу), а после — анимировали в Kling, задав направление движения каждого объекта.
https://www.midjourney.com/
https://kling.kuaishou.com/

КиберХаб | БотGPT

https://t.me/kyberhub/3448

Дискогрыз полиморфный обыкновенный, редчайшей породы гад, падла зеленая...
  • +0.03 / 3
  • АУ
ПетрР
 
russia
Воронеж
Слушатель
Карма: +0.00
Регистрация: 04.02.2024
Сообщений: 312
Читатели: 0
Н-да.
.Скоро видео и фото в качестве улик ,или доказательств, приниматься Не будут!
  • +0.05 / 2
  • АУ
small__virus
 
russia
Сочи
Слушатель
Карма: +37.38
Регистрация: 04.04.2013
Сообщений: 2,202
Читатели: 5
****
Новость   1.202 0
Цитата: Телеграм-канал GigaChat ✔

https://t.me/official_gigachat/1380


Как оживить любой арт в нейросети 🔥

Художники ликуют — у Minimax вышло обновление, заточенное под 2D-иллюстрации. Модель распознаёт множество стилей и позволяет анимировать отдельные элементы изображений

Как работает нейросеть:
⭕️заходим на сайт и логинимся через почту Google
⭕️переходим во вкладку “Image to video“
⭕️справа от текстовой строки выбираем новую модель “12V-01-live“
⭕️нажимаем на иконку 🖼 и загружаем изображение
⭕️пишем запрос на английском в текстовую строку, например: “waving hands“
⭕️проверьте, чтобы у вас была активна иконка 🔗 для улучшения промпта
⭕️нажимаем на иконку 🐚 ракушки для генерации

Мы проверили нейросеть на разных иллюстрациях — она отлично справляется с комиксами и аниме, пиксель-арт пока понимает хуже, результат оцените сами ⬆️

Сервис предлагает 100 бесплатных кредитов каждый день — их хватит на анимацию трёх роликов. Платная подписка начинается от $9 в месяц
Дискогрыз полиморфный обыкновенный, редчайшей породы гад, падла зеленая...
  • +0.05 / 4
  • АУ
small__virus
 
russia
Сочи
Слушатель
Карма: +37.38
Регистрация: 04.04.2013
Сообщений: 2,202
Читатели: 5
Цитата: ПетрР от 05.12.2024 16:48:37Н-да.
.Скоро видео и фото в качестве улик ,или доказательств, приниматься Не будут!

Я думаю, внедрение подписи в камеру это легко исправит.
Нейросети легко справляются с фото/видео/аудио, но криптография никогда не станет их сильной стороной.
Дискогрыз полиморфный обыкновенный, редчайшей породы гад, падла зеленая...
  • +0.05 / 3
  • АУ
Senya
 
russia
56 лет
Слушатель
Карма: +333.96
Регистрация: 20.11.2008
Сообщений: 27,858
Читатели: 53

Глобальный Модератор
Цитата: small__virus от 06.12.2024 10:30:35Я думаю, внедрение подписи в камеру это легко исправит.

Я думал об этом, но всегда остаётся вариант синтезировать изображение и спроецировать его на вход сертифицированной камеры.
"Иван Грозный помещает на рабочий стол полученный от хана ярлык."(с) Не моё.
  • +0.12 / 8
  • АУ
small__virus
 
russia
Сочи
Слушатель
Карма: +37.38
Регистрация: 04.04.2013
Сообщений: 2,202
Читатели: 5
Цитата: Senya от 06.12.2024 10:40:06Я думал об этом, но всегда остаётся вариант синтезировать изображение и спроецировать его на вход сертифицированной камеры.

Вариант, конечно. Но...
Тут нужно понимать, что если захочет спецслужба - то вам ничего не поможет.
Но на бытовом уровне, наверное, можно...
В камеру можно поставить копеечную систему невскрываемости. Вроде как у банковских терминалов - его если вскрыли, то только на завод. Ибо там вплоть до стирания ПЗУ-хи.
А напрямую в глазок синтезить, все равно будут косяки. Да и нейросети по самому принципу своей работы, все равно так или иначе накосячат.
Дискогрыз полиморфный обыкновенный, редчайшей породы гад, падла зеленая...
  • +0.04 / 2
  • АУ
Senya
 
russia
56 лет
Слушатель
Карма: +333.96
Регистрация: 20.11.2008
Сообщений: 27,858
Читатели: 53

Глобальный Модератор
Цитата: small__virus от 06.12.2024 10:48:24Тут нужно понимать, что если захочет спецслужба - то вам ничего не поможет.

Эту фразу по хорошему надо включать во все книги по криптографии, начиная от мурзилочного уровня (ну да в нормальные она и включена, в том или ином виде).
Цитата: small__virus от 06.12.2024 10:48:24А напрямую в глазок синтезить, все равно будут косяки. Да и нейросети по самому принципу своей работы, все равно так или иначе накосячат.

Понятно, что здесь уже речь идёт о соревновании снаряда и брони.
"Иван Грозный помещает на рабочий стол полученный от хана ярлык."(с) Не моё.
  • +0.08 / 6
  • АУ
Сейчас на ветке: 2, Модераторов: 0, Пользователей: 0, Гостей: 1, Ботов: 1