Speech and Language Technology (Technologia Mowy i Języka)
Historia
Komitet naukowy, redaktorzy
Zakres tematyczny
Informacje dla autorów
Recenzenci
Zasady recenzowania
Deklaracja o wersji pierwotnej
Tomy
Historia
Rocznik Technologia Mowy i Języka - Speech and Language Technology (SLT) jest wydawany przez Polskie Towarzystwo Fonetyczne od prawie 40 lat (pierwotnie pod tytułem "Synteza i analiza mowy"). Pierwszym redaktorem naczelnym był prof. Wiktor Jassem, drugim ( i obecnym) - prof. Grażyna Demenko.
Pismo ukazuje się w wersji papierowej (pierwotna), a aktualny tom zawsze jest udostępniany w całości w wersji elektronicznej. Wcześniejsze tomy można przeglądać na stronie czasopisma. Osoby zainteresowane uzyskaniem dostępu do do nich proszone są o kontakt z redakcją: ptfon@ptfon.pl.
Komitet naukowy rocznika (aktualny, 2012 r.):
Demenko Grażyna (Uniwersytet im. A. Mickiewicza w Poznaniu),
Gibbon Dafydd (Uniwersitaet Bielefed, Niemcy),
Keikichi Hirose (Department of Information and Communication Engineering, University of Tokyo),
Tadeusiewicz Ryszard (Akademia Górniczo-Hutnicza w Krakowie)
Redaktor językowy: Agnieszka Wagner
Redaktor techniczny: Mariusz Owsianny
Prace publikowane w roczniku poruszają zagadnienia z następujących dziedzin:
- technologii i przetwarzania mowy i języka (włączając syntezę i rozpoznawanie mowy),
- szeroko pojętej lingwistyki,
- fonetyki, produkcji, percepcji i akustyki mowy,
- prozodii,
- nauczania języków obcych (szczególnie w odniesieniu do wymowy i prozodii),
- fonetyki w zastosowaniach medycznych oraz
- zasobów językowych (w odniesieniu do tworzenia i anotacji korpusów, leksykonów)
Wszystkich zainteresowanych opublikowaniem w SLT wyników prowadzonych badań prosimy o nadsyłanie prac na adres mailowy ptfon@ptfon.pl.
Artykuły powinny mieć objętość między 12-20 stron, tj. 3500-6500 wyrazów nie licząc bibliografii, w tym streszczenie w języku polskim i angielskim na ok. 200-300 słów. Prace należy przesłać w odpowiednim formacie - szablon dostępny jest tutaj.
Izdebski Krzysztof (Santa Clara University, Pacific Voice and Speech Foundation, USA),
Andrzej Izworski (Akademia Górniczo-Hutnicza w Krakowie),
Krzysztof Jassem(Uniwersytet im. Adama Mickiewicz w Poznaniu),
Ela Thurgood (California State University),
Piotr Wierzchon (Uniwersytet im. Adama Mickiewicz w Poznaniu),
Wieslaw Wszolek (Akademia Górniczo-Hutnicza w Krakowie)
- do oceny każdej publikacji powołuje się, co najmniej dwóch niezależnych recenzentów spoza jednostki naukowej afiliowanej przez autora publikacji
- autor lub autorzy publikacji i recenzenci nie znają swoich tożsamości (double-blind review process)
- pisemna recenzja zawiera jednoznaczny wniosek recenzenta dotyczący warunków dopuszczenia artykułu naukowego do publikacji lub jego odrzucenia
- formularz recenzji, na podstawie którego recenzenci dokonują oceny artykułu jest dostępny tutaj
- nazwiska recenzentów poszczególnych publikacji lub numerów wydań czasopisma naukowego nie są ujawniane
Deklaracja o wersji pierwotnej
Wersją pierwotną rocznika SPEECH AND LANGUAGE TECHNOLOGY jest wersja drukowana.
Aktualny tom i poprzednie wydania:
Aby pobrać najnowszy tom SLT vol. 14/15 kliknij tutaj.
Osoby zainteresowane dostępem do artykułów z poprzednich wydań proszone są o kontakt z redakcją (e-mail: ptfon@ptfon.pl).
Aby przejrzeć zawartość wybranego rocznika należy wybrać link z listy poniżej:
- vol. 14/15 (2011/2012), wydanie bieżące
- vol. 14/15 (2011/2012), wydanie specjalne, jubileuszowe
- vol. 12/13 (2009/2010)
- vol. 11 (2008)
- vol. 9/10 (2006/2007)
Informacje o zawartości tomów 7 i 8 oraz wybrane artykuły udostępniamy na życzenie osób zainteresowanych.
vol. 14/15 (2011/2012), wydanie bieżące
Część 1: Aplikacje
Modelowanie intonacji dla syntezy mowy neutralnej
Grażyna Demenko, Tomasz Kuczmarski
Przegląd metod w syntezie mowy opartej na niejawnych modelach Markowa
Tomasz Kuczmarski
Ewaluacja mowy syntetycznej za pomocą automatycznego rozpoznawania mowy z modelem adaptowanym do mówcy
Jolanta Bachan, Tomasz Kuczmarski i Piotr Francuzik
Ewaluacja systemu rozpoznawania mowy polskiej
Mariusz Owsianny, Piotr Francuzik
Część 2: Zasoby i narzędzia
Zastosowanie bazy “Paralingua” do badania stanów afektywnych i cech para lingwistycznych
Katarzyna Klessa, Agnieszka Wagner, Magdalena Oleśkowicz-Popiel
Wstępna ocena bazy nagrań mowy pod wpływem alkoholu
Małgorzata Zagrodnicka
Zgodność anotacji segmentalnej i prozodycznej w polskiej bazie Jurisdict
Marcin Szymański, Jolanta Bachan
Skuteczność programów dopasowujących angielsko-polskie teksty równoległe na poziomie zdania
Grzegorz Krynicki
Część 3: Analiza
Intonacja pytań w koreańskich i polskich dialogach zadaniowych
Analiza mowy spontanicznej z wykorzystaniem modelowania percepcyjnego
Maciej Karpiński, Emilia Szalkowska-Kim
Akustyczna realizacja długich dyftongów w Hainan Cham
Ela Thurgood
Produkcja i percepcja mowy emocjonalnej w języku polskim: ramy analizy
Agnieszka Wagner
vol. 14/15 (2011/2012), wydanie specjalne, jubileuszowe
Part 1: Methodology (Metodologia)
Formal models of oscillation in rhythm, melody and harmony (Formalne modele oscylacji w rytmie, melodii i harmonii)
Dafydd Gibbon
Intonation processing for speech technology (Przetwarzanie intonacji dla technologii mowy)
Grażyna Demenko
Part 2: Rhythm - duration and timing (Rytm - iloczas i wzorce czasowe)
Rhythm in L2 speech (Rytm w mowie L2)
Ulrike Gut
Polish segmental duration: selected observations based on corpus data (Iloczas głoskowy w języku polskim: obserwacje wybrane w oparciu o dane korpusowe)
Katarzyna Klessa
Acoustic-phonetic realisation of Polish syllable prominence: a corpus study (Akustyczno-fonetyczna realizacja wzmocnienia polskiej sylaby: korpusowe badanie mowy spontanicznej)
Zofia Malisz and Petra Wagner
Part 3: Melody - intonation and pitch (Melodia - intonacja i wysokość tonu)
An analysis of laryngeal aperture regulation in relation to larynx height change using simultaneous laryngoscopy and laryngeal ultrasound (Analiza regulacji otwarcia względem wysokości krtani z wykorzystaniem jednoczesnej laryngoskopii i ultradźwiękowego obrazowania krtani)
John Esling and Scott R Moisik
Absolute pitch: an unusual type of memory for standard musical scale (Słuch absolutny: niezwykły rodzaj pamięci dotyczący standardowej skali muzycznej)
Andrzej Rakowski
Automatic labeling of prosody (Automatyczna anotacja prozodii)
Agnieszka Wagner
Part 4: Harmony - segments in context (Harmonia - segmenty w kontekście)
Holistic perception of phonological variants (Holistyczna percepcja wariantów fonologicznych)
Linda Shockey and Zinny Bond
Part 5: Biography and bibliography (Biografia i bibliografia)
Views and vita (Przemyślenia i życiorys)
Publications of Wiktor Jassem (Publikacje Wiktora Jassema)
vol. 12/13 (2009/2010)
Part 1: Phoniatrics (edited by Krzysztof Izdebski)
Integrated Spatio-Temporal Analysis of High-Speed Laryngeal Imaging and Acoustic Signals: Their Role and Applications in the Study of Normal and Abnormal Vocal Functions (Zintegrowana przestrzenno-czasowa analiza wysokoczułego obrazowania krtani i sygnałów akustycznych: ich rola i zastosowanie w badaniu prawidłowych i nieprawidłowych funkcji głosu)
Yuling Yan, Krzysztof Izdebski
Outcome of F0 determination using acoustic and electroglottographic algorithms (Wyniki wyznaczania F0 z wykorzystaniem algorytmów akustycznych i elektroglotograficznych)
Wiesław Wszołek, Maciej Kłaczyński
Expressive speech as a tool for human-computer interaction (Mowa ekspresywna jako narzędzie interakcji człowiek-komputer)
Grażyna Demenko
In search of a framework for speech emotion recognition (W poszukiwaniu ram koncepcyjnych dla rozpoznawania emocji w mowie)
Magdalena Jastrzębska
Part 2: Language processing (edited by Dafydd Gibbon)
A comparison of search algorithms for syntax-based statistical machine translation (Porównanie algorytmów wyszukiwania dla opartego na składni tłumaczenia maszynowego)
Marcin Junczys-Dowmunt
An attempt to automatically translate into the sign language emotionally colored textual utterances (Próba automatycznego tłumaczenia na język migowy emocjonalnie zabarwionych wypowiedzi tekstowych)
Julia Romaniuk, Nina Suszczańska, Przemysław Szmal
A sentence Clustering Algorithm for Specialized Translation Memories (Analiza skupień zdań na potrzeby wyspecjalizowanych pamięci tłumaczeń)
Rafał Jaworski
Classification of translation pairs for the purpose of creating domain dictionaries (Klasyfikacja par tłumaczeń dla tworzenia dużych słowników dziedzinowych)
Marcin Walas
Comparison of selected morphological analysers for Polish (Porównanie wybranych analizatorów morfologicznych dla języka polskiego)
Błażej Adamczyk
Part 3: Phonetics (edited by Elżbieta Thurgood)
Tonal variation in identical and conflicting contexts: A case study of Anong disyllabic utterances (Wariantywność tonalna w identycznych i sprzecznych kontekstach: studium dwusylabowych wypowiedzi języka Anong)
Ela Thurgood
Creation of the linguistic content for the pronunciation tutoring system AzAR 3.0 (Tworzenie zawartości językowej dla systemu do treningu wymowy AzAR 3.0)
Agnieszka Wagner, Natalia Cylwik
Prosodic inference with the ZDATR default inference engine (Prozodyczne wnioskowanie z domyślnym silnikiem wnioskowania ZDATR)
Dafydd Gibbon
Part 4: Speech synthesis and recognition (edited by Ryszard Tadeusiewicz)
SOM network for LVCSR Speech Recognition (Sieć SOM dla rozpoznawania mowy LVCSR)
Leszek Gajecki, Ryszard Tadeusiewicz
Speechlabs ASR. Polish Lexical Database for Speech Technology: Design and Architecture (Speechlabs ASR: Polska Leksykalna Baza Danych do zastosowań w technologii mowy. Projekt i architektura)
Katarzyna Klessa, Maciej Karpiński, Olga Bałdys, Grażyna Demenko
Speaker adaptation in speech recognition systems using neural networks (Adaptacja mówcy w systemach rozpoznawania mowy za pomocą sieci neuronowych)
Michał Dyrek
HMM-based Speech Synthesis Applied to Polish (System syntezy mowy oparty na ukrytych modelach Markowa
dla języka polskiego)
Tomasz Kuczmarski
Tools for automatisation of voice creation for diphone based speech synthesis (Narzędzia do automatyzacji tworzenia głosów dla difonowej syntezy mowy)
Jolanta Bachan
Part 5: Reports and technical papers (edited by Zbigniew Rau)
Speech perception and the application of automatic speech recognition system for the recording of testimonies
made in the course of court proceedings
Anna Demenko
Human voice as a right protected by the law
Jakub Dąbrowski
Automatic speech recognition systems (ASRS) in homeland security systems – their use in
police operations
Zbigniew Rau, Dariusz Pilarczyk
Technologies of processing and recognition of verbal information in homeland security systems (Technologie przetwarzania oraz rozpoznawania informacji słownych w systemach bezpieczeństwa wewnętrznego)
Grażyna Demenko, Stefan Grocholewski
vol. 11 (2008)
Part 1: Speech and speaker recognition
Modeling of man auditory system as a method for automatic speech recognition systems improvement (Modelowanie systemu słuchowego człowieka jako metoda doskonalenia systemów automatycznego rozpoznawania mowy)
Ryszard Tadeusiewicz
Acoustical parameters of target voices and their imitators
Wojciech Majewski and Piotr Staroniewicz
First evaluation of Polish LVCSR acoustic models obtained from the JURISDIC database
Marcin Szymański, Jerzy Ogórkiewicz, Marek Lange, Katarzyna Klessa,
Stefan Grocholewski, and Grażyna Demenko
An Investigation into the Intra- and Inter-labeller Agreement in the JURISDIC Database
Katarzyna Klessa and Jolanta Bachan
Telephony Based Voice Portal for a University
Łukasz Brocki, Danijel Koržinek, Krzysztof Marasek
The system architecture of a speech database via the WWW (Baza nagrań głosowych z dostępem poprzez Internet)
Andrzej Izworski, Piotr Pracuch, Jarosław Bułka, and Ireneusz Wochlik
Modeling of Polish language for Large Vocabulary Continuous Speech Recognition (Modelowanie języka polskiego dla ciągłego rozpoznawania mowy z uwzględnieniem obszernego zakresu słownictwa)
Leszek Gajecki and Ryszard Tadeusiewicz
Part 2: Speech analysis and synthesis
Synthesis of F0contours for Mandarin speech by superposing corpus-generated tone contours on rule-generated phrase components
Keikichi Hirose, Qinghua Sun, and Nobuaki Minematsu
The design of Polish Speech Corpus for Unit Selection Speech Synthesis
Grażyna Demenko, Bernd Möbius, and Katarzyna Klessa
A Model of Personalized Audio-Visual TTS-synthesis for Russian
B. Lobanov, L. Tsirulnik, A. Ronzhin, and A. Karpov
Preliminary Results of Expressive Speech Synthesis in Polish
Jolanta Bachan and Barbara Surmanowicz
Aspects of gestural and prosodic structure of multimodal utterances in Polish task-oriented dialogues
Maciej Karpiński, Ewa Jarmołowicz-Nowikow, and Zofia Malisz
The use of CALL in acquiring foreign language pronunciation and prosody – General specifications for Euronounce Project
N. Cylwik, G. Demenko, O. Jokisch, R. Jäckel, M. Rusko, R. Hoffmann, A. Ronzhin, D. Hirschfeld, U. Koloska, and L. Hanisch
An acoustic database gathered for the purpose of creating a detector of selected pronunciation errors appearing in English spoken by Poles (Akustyczna baza danych zgromadzona na potrzeby układu detekcji wybranych błędów wymowy w mowie angielskiej Polaków)
Grzegorz Krynicki, Dawid Pietrala, Katarzyna Dziubalska-Kołaczyk, Mikołaj Wypych
Automatic assessment of distortions in isolated sounds in dysarthia disease (Automatyczna ocena zaburzeń realizacji głosek w dyzartrii)
Tomasz Orzechowski, Katarzyna Chmurzyńska, Piotr Radkowski, Andrzej Izworski
Computational tools in the analysis of phonetic grammar
Krzysztof Dyczkowski, Norbert Kordek, Paweł Nowakowski, and Krzysztof Stroński
Part 3: Language processing
English grapheme-to-phoneme conversion and evaluation
Uwe Reichel, Hartmut R. Pfitzinger, and Horst-Udo Hain
Automatic correction of part-of-speech corpora
Uwe Reichel, Lia Saki Bucar Shigemori
Semantic Modelling for Speech Recognition
Bartosz Ziółko, Suresh Manandhar, Richard C. Wilson, and Mariusz Ziółko
Problems of Disambiguation in the Thetos-3 System
Nina Suszczańska, Przemysław Szmal
Corpora based Approach for Arabic/English Word Translation Disambiguation
Farag Ahmed and Andreas Nürnberger
Overcoming Agglutination Difficulties in the Development of an MT system from the Azerbaijani Language
Rauf Fatullayev, Ali Abbasov, and Abulfat Fatullayev
A Linguistically Light Approach to Multilingualism in Lexical Layers for Ontologies
Alexander Troussov, John Judge, Mikhail Sogrin, Amine Akrout, Brian Davis, and Siegfried Handschuh
SuperMatrix: A General Tool for Lexical Semantic Knowledge Acquisition
Bartosz Broda and Maciej Piasecki
Modeling the Frequency of Phrasal Verbs with Search Engines
Grażyna Chamielec and Dawid Weiss
SemCAPTCHA - the user-friendly alternative for OCR-based CAPTCHA systems
Paweł Łupkowski and Mariusz Urbański
vol. 9/10 (2006/2007)
Part 1: Phonetics and Phonology (Fonetyka i Fonologia)
Homophones in Polish (Polskie homofony)
Maria Steffen-Batóg, Tadeusz Batóg
Disfluencies in Polish and Thai task-oriented dialogue (Zaburzenia płynności w polskich i tajskich dialogach zadaniowych)
Janusz Kleśta, Maciej Karpiński
A set of speech perception tests for children with cochlear implants – preliminary evaluation (Zestaw testów percepcyjnych mowy dla dzieci z implantami ślimakowymi – wstępna ewaluacja)
Jerzy Ogórkiewicz, Jolanta Bachan, Małgorzata Mazur, Mariusz Owsianny, Dariusz Komar, Grażyna Demenko
Elliptic sentences processing in the Thetos translation system (Przetwarzanie zdań eliptycznych w systemie tłumaczącym Thetos)
Nina Suszczańska, Julia Romaniuk, Przemysław Szmal
Part 2: Prosodic Analysis (Analiza Prozodyczna)
Prosody of Hungarian Imperative Sentences (Prozodia węgierskich zdań rozkazujących)
Ilona Koutny
Prosodic features in simultaneous interpreting (Cechy prozodyczne w tłumaczeniu symultanicznym)
Natalia Cylwik
Sentence Intonation for Polish Language (Prozodia wypowiedzi w języku polskim)
Bożena Piorkówska, Janusz Rafałko, Wojciech Lesiński, Edward Szpilewski
A Study of Chosen Temporal Relations within Syllable Structure in Polish (Analiza wybranych związków iloczasowych zachodzących w obrębie sylaby w języku polskim)
Katarzyna Klessa, Daniel Śledziński
Part 3: Speech synthesis and speech recognition (Synteza i Rozpoznawanie Mowy)
Study of Idiosyncrasy of Syntagmatic Segmentation for Personal Speaking Manner Cloning by TTS
Boris Lobanov, Liliya Tsirulnik, Anatoly Fiodorov
Talking blogs – an attempt to give weblogs a voice Adding TTS functionality to Wordpress
Arne Hellmich
Automatic Close Copy Speech Synthesis (Synteza mowy metodą automatycznego dokładnego kopiowania)
Jolanta Bachan
The role of discourse markers in the synthesis of Hungarian prosody (Rola markerów dyskursu w syntezie prozodii węgierskiej)
Ilona Koutny
Building speaker identification systgem using Hidden Markov Model Toolkit (Rozpoznawanie mówców przy pomocy zestawu narzędzi HTK)
Marek Lange
Semi-automatic segmentation of speech: manual segmentation strategy based on error prediction (Pół-automatyczna segmentacja nagrań mowy: strategia segmentacji ręcznej w oparciu o predykcję błędu
Marcin Szymański and Stefan Grocholewski
The use of statistics of Polish phonemes in speech Recognition (Zastosowanie statystyk fonemów języka polskiego w rozpoznawaniu mowy)
Bartosz Ziółko, Jakub Gałka, Suresh Manandhar, Richard C. Wilson, Mariusz Ziółko
Building lexica for application in a speech dictation system (Tworzenie leksykonów do zastosowania w systemie dyktowania mowy)
Agnieszka Wagner, Grażyna Demenko
Acoustical Analysis of the Polish Syllables for Needs of the Speech Technology (Analiza cech akustycznych sylab języka polskiego na potrzeby technologii mowy)
Daniel Śledziński
The evaluation of recordings’ quality in the database created for the automatic speech recognition system (Ocena jakości nagrań w bazie danych dla systemu rozpoznawania mowy)
Daniel Śledziński