Ticho škodí (přepisu řeči do textu)
Téma indítója: Milan Condak
Milan Condak
Milan Condak  Identity Verified
Local time: 23:46
angol - cseh
Dec 5, 2023

Měl jsem plán: stáhnu si všechna videa z Odoo Experience 2023 a přepíšu si je automaticky do textu a do titulků. Akce trvala tři dny: 8-10.11.2023 a přepis dokončím do 15.11.2023.
Po několika minutách od ukončení živého přenosu byla videa k dispozici. Videa jsem stáhl a zvuk jsem přepsal, termín jsem dodržel.
Jenže, jazykový model Whisper V2.0 vytvořil pouze 170 textů z 337 disponibilních videí.
Youtube vytváří automatické přepisy pouze pro "v
... See more
Měl jsem plán: stáhnu si všechna videa z Odoo Experience 2023 a přepíšu si je automaticky do textu a do titulků. Akce trvala tři dny: 8-10.11.2023 a přepis dokončím do 15.11.2023.
Po několika minutách od ukončení živého přenosu byla videa k dispozici. Videa jsem stáhl a zvuk jsem přepsal, termín jsem dodržel.
Jenže, jazykový model Whisper V2.0 vytvořil pouze 170 textů z 337 disponibilních videí.
Youtube vytváří automatické přepisy pouze pro "velké" jazyky a přepis je méně přesný než přepis vyhotovený pomocí velkého modelu Whisper. Youtube vytvořil automatický přepis téměř ze všech videí. Zajímavé je, že některé titulky jsou dlouhé a jiné jsou krátké. Zatím jsem nezkoumal proč.
Otázka zněla: Proč Whisper vůbec nepřepsal polovinu videí? Jak přepis udělat?
Odpověď: odstřihnout TICHO.
Ukázka jednoho videa:
https://www.youtube.com/watch?v=s_PHEiNpkC4&list=PL1-aSABtP6ABxfzTiEkvg3HnRhBLFcYhk&index=182

0:37 / 25:35

Přepis textu ze 14.11. vypadá takto:
Test test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . atd.

Přepis titulků obsahuje časy, první titulek Test test, další titulky obsahují tečku :
1
00:00:00,000 --> 00:00:02,000
Test test

2
00:00:30,000 --> 00:00:32,000
.

3
00:01:00,000 --> 00:01:02,000
.
atd.
---
Přepis Youtube zobrazuje, že první titulek začíná 3:10 minut.
3:10
okay good uh good afternoon everyone
3:12
thank you very much for joining this
3:14
presentation uh so it's called flavorful
---
Video otevřu v SubtitleEdit (SE), poznačím si časy:
SUB start: 3:10
SE Konec, trvání: 25:35:582 (opis)
SE konec řeči: 25:26 (vyhledáno, ověřeno)
SE start: 3:10 (vyhledáno, ověřeno)
Trvání: 22:16 rozdíl Konec-Start, upravil jsem na 22:22

a napíšu příkaz pro program ffmpeg:
ffmpeg -ss 0:03:10 -i "193.mp4" -to 0:22:22 -c copy 193-s.mp4

Původní soubor
193.mp4 107 939 876 13.11.2023 08:09
Soubor bez úvodního ticha
193-s.mp4 95 715 538 05.12.2023 12:00

Soubor bez úvodního ticha model Whisper zpracuje.
Nedokončená práce na odstraňování ticha způsobila, že jsem už dlouho zticha.
Ještě nějakou dobu zticha budu.

Milan
Collapse


 


Ehhez a fórumhoz nincs külön moderátor kijelölve.
Ha a webhely szabályainak megsértését kívánja jelenteni, vagy segítségre van szüksége, lépjen kapcsolatba a webhely munkatársaival ».


Ticho škodí (přepisu řeči do textu)






CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

Buy now! »
Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

Buy now! »