En 2022, SPPAS a remporté une récompense Science Ouverte.
Mais saviez-vous que... tout a commencé par un simple constat :
Mes collègues réalisent la tâche de segmentation
phonétique manuellement alors qu'il existe des outils automatiques !
Le constat : deux disciplines, deux pratiques
Au départ, un besoin : multiple !
Segmentation phonétique pour de la parole :
conversationnelle en français
de patients (maladie de parkinson, SLA, ...), en français
collectées durant des expériences en psycho-linguistique, en anglais
en vue d'analyses prosodiques, de l'italien, avec des mots et non-mots
de textes lus, en mandarin
... et bien d'autres
SPPAS se positionne à l'interface des deux disciplines
SPPAS depuis 2012 : Une histoire de diffusion réussie
ou... comment un simple outil interne s'est-il transformé en logiciel adopté internationalement ?
Etape 1 : Les licences... libres (plutôt qu'open source)
La Free Software Foundation définit le logiciel libre comme
un logiciel que les utilisateurs
sont libres d’exécuter, de copier, de distribuer, d’étudier, de modifier et d’améliorer.
Etape 2 : créer une identité
Un nom distinctif et universel : "L'aligneur de Brigitte"... devient SPPAS
n'existe dans aucune langue comme nom commun
n'existe pas comme nom propre sur les moteurs de recherche
Bigi, B. (2015).
SPPAS - MULTI-LINGUAL APPROACHES TO THE AUTOMATIC ANNOTATION OF SPEECH.
The Phonetician. Journal of the International Society of Phonetic Sciences,
Journal of ISPhS/International Society of Phonetic Sciences, 111-112
(ISSN:0741-6164), pp.54-69.
Copyright (C) 2024 Brigitte Bigi, CNRS.
Permission is granted to copy, distribute and/or modify this document
under the terms of the GNU Free Documentation License, Version 1.3
or any later version published by the Free Software Foundation;
with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts."
Annexes
SPPAS en quelques chiffres
14, 23, 30, 170, 535, 1400, 106k, 89k
14 : nombre de langues supportées par les annotations
23 : nombre d'annotations, dont 5 pour la segmentation phonétique
30 : nombre d'articles publiés
170 : nombre de pages de la documentation utilisateurs
> 535 : nombre de citations
> 1400 : nombre de téléchargements/an
106k lignes de code python + 89k de commentaires et docstrings