Subtitles / Untertitel

Voctoweb hat mehr aktuell zwei Varianten über die publizierte Vorträge Untertitel bekommen können:

die klassischen Workflows über die Django-App auf c3subtitles.de (subtitleStatus)
per Whisper/Transcribee über die Publishing API

Vereinfacht gesagt geht es dabei immer um zwei Tasks:

das Publizieren der SRT/VTT Datei
das Anlegen der Metadaten (aka “Subtitle Recording”) in voctoweb, damit die Untertitel auch im Player angezeigt werden

Um sich nicht mit den Eigenheiten der c3voc Infrastrktur herumschlagen zu müssen wurde 2023/2024 eine REST API eingerichtet die es erlaubt Zusatzdaten wie Slides, Subtitles etc. rein per REST zu publizieren, ohne das SFTP o.ä. verwendet werden muss:

Die dazu notwendigen API Keys sind aktuell noch statisch konfiguriert, sollen aber perspektivisch an https://sso.c3voc.de/ angebunden werden.

Components

sync_media_recordings.py uses CSV export from subtitlesStatus to publish subtiles in vocotoweb via REST API:
- is run every 10 minutes via systemd timer releasing.c3voc.de:/etc/systemd/system/publish-subtitles.timer
subtitleStatus (Django-App @ c3subtitles.de)
- Dashboard mit Übersicht des Transkriptionsstatus pro Konferenz und Vortrag
- Workflow-Manager
- …
- schiebt fertige Untertitel-Dateien (SRT) per rsync auf mirror.selfnet.de

https://c3subtitles.de/media_export/2020-12-30T0:00:00.99Z

Example:

`GUID`	`complete`	`media_language`	`srt_language`	`last_changed_on_amara`	`revision`	`url`	`touched`	`amara_key`	`amara_language`	`state`	`amara_subtitle_url`
db11e86c-ecf8-40c0-b8d8-2f6798507146	False	eng	en	1-01-01T00:00:00Z	1	https://mirror.selfnet.de/c3subtitles/events/rc3/rc3-mcr-11546-eng-deu-Measuring_radioactivity_using_low-cost_silicon_sensors.en.srt	2021-01-03T12:30:45Z	P4gHpqpuJJIA	en	7	https://amara.org/api/videos/P4gHpqpuJJIA/languages/en/subtitles/
221560a2-7470-4e90-9190-99a2bef53238	False	deu	de	1-01-01T00:00:00Z	1	https://mirror.selfnet.de/c3subtitles/events/rc3/rc3-mcr-11574-deu-Globalisierung_Digitalisierung_und_die_Wachstumsfrage.de.srt	2021-01-06T10:37:48Z	dSkmesksKqIe	de	2	https://amara.org/api/videos/dSkmesksKqIe/languages/de/subtitles/
6beabddc-2dd6-43d2-9936-618d41d42cde	True	deu	de	1-01-01T00:00:00Z	5	https://mirror.selfnet.de/c3subtitles/congress/35c3/35c3-9744-deu-eng-Inside_the_Fake_Science_Factories.de.srt	2021-01-01T23:14:02Z	vsf2PBryeqW9	de	8	https://amara.org/api/videos/vsf2PBryeqW9/languages/de/subtitles/
7bdf7688-8620-4170-93bf-3c2adfd30030	False	deu	de	1-01-01T00:00:00Z	1	https://mirror.selfnet.de/c3subtitles/congress/36c3/36c3-10983-deu-eng-Its_alive_-_Nach_den_Protesten_gegen_die_Polizeigesetze_ist_vor_den_Protesten_gegen_die_autoritaere_Wende.de.srt	2020-12-30T10:58:21Z	NWHl9bK0MXF8	de	2	https://amara.org/api/videos/NWHl9bK0MXF8/languages/de/subtitles/
52ce1398-fa9b-4bd3-aa9e-6a49a764ac2c	True	deu	de	1-01-01T00:00:00Z	7	https://mirror.selfnet.de/c3subtitles/congress/35c3/35c3-9343-deu-eng-Court_in_the_Akten.de.srt	2021-01-04T22:17:06Z	3mDTDpROSDxZ	de	8	https://amara.org/api/videos/3mDTDpROSDxZ/languages/de/subtitles/
1cff41a8-455e-42a6-ab08-d6cb166e7d3b	False	deu	de	1-01-01T00:00:00Z	1	https://mirror.selfnet.de/c3subtitles/congress/35c3/35c3-10036-deu-eng-Mondnacht.de.srt	2021-01-04T22:12:21Z	gAbEiRm8Mocc	de	2	https://amara.org/api/videos/gAbEiRm8Mocc/languages/de/subtitles/

To download the raw (draft) subtitles from Amara, append use https://amara.org/api/videos/{amara_key}/languages/{amara_lanuage}/subtitles/?format=vtt (compare https://apidocs.amara.org/#fetch-raw-subtitles)

States

For voctoweb (media.ccc.de) only states 7, 8 and 12 are relevant. Subtitle files in all other states should be ignored.

ID	voctoweb	c3subtitles	additional information
1		Nothing available yet	irrelevant should not exist
2	todo	Transcribed until	should exist
3		Transcript finished	might exist - still no timestamps
4		Please do not touch, work in progress	Autotiming in process no timestamps
5		Synced until	rare case of syncing by hand
6		Syncing finished	with timestamps, usable as draft
7	draft	Quality control done until	with timestamps, usable as draft
8	complete	Job completed	finished, obviously with timestamps and usable
9		Unknown	should not exist
11	todo	Translated until	translation, not usable as draft
12	translated	Translation is finished	finished, obviously with timestamps and usable

Achtung: Der Rest dieser Seite wird ggf. nicht mehr aktiv gepflegt. Das Team hat inzwischen eigene Infrastruktur: https://wiki.c3subtitles.de

Subtitles / Untertitel

Publishing Gateway/API

Classic workflows

CSV-Export from C3Subtitles:

States

Communication