Million Song Dataset

Million Song Dataset

“The Million Song Dataset is a freely-available collection of audio features and metadata for a million contemporary popular music tracks” - Including Lyrics, and more

BBC Sound Effects Archive Resource
Mozilla Common Voice

Mozilla Common Voice

Freie und Crowd-gesourcte Stimmerkennungs-Datensätze. Common Voice ist ein öffentlich verfügbarer Sprachdatensatz, der durch Stimmen freiwilliger Mitwirkender auf der ganzen Welt geschaffen wird. Menschen, die Sprachanwendungen erstellen möchten, können den Datensatz verwenden, um Modelle für maschinelles Lernen zu trainieren. Man die Datensätze auch direkt herunterladen unter: https://datacollective.mozillafoundation.org/datasets?q=common+voice

Chaosradio Folge 243: Open Data und Datenjournalismus
Die Linkliste für Datascience, Datenvisualisierung und Open Data.