Speech and Language Technology (Technologia Mowy i Języka)

Posted by wagner.agnieszka on wt., 25/09/2012 - 10:55

Historia
Komitet naukowy, redaktorzy
Zakres tematyczny
Informacje dla autorów
Recenzenci
Zasady recenzowania
Deklaracja o wersji pierwotnej
Tomy

Historia

Rocznik Technologia Mowy i Języka - Speech and Language Technology (SLT) jest wydawany przez Polskie Towarzystwo Fonetyczne od prawie 40 lat (pierwotnie pod tytułem "Synteza i analiza mowy"). Pierwszym redaktorem naczelnym był prof. Wiktor Jassem, drugim ( i obecnym) - prof. Grażyna Demenko.

Pismo ukazuje się w wersji papierowej (pierwotna), a aktualny tom zawsze jest udostępniany w całości w wersji elektronicznej. Wcześniejsze tomy można przeglądać na stronie czasopisma. Osoby zainteresowane uzyskaniem dostępu do do nich proszone są o kontakt z redakcją: ptfon@ptfon.pl.

Komitet naukowy rocznika (aktualny, 2012 r.):

Demenko Grażyna (Uniwersytet im. A. Mickiewicza w Poznaniu),
Gibbon Dafydd (Uniwersitaet Bielefed, Niemcy),
Keikichi Hirose (Department of Information and Communication Engineering, University of Tokyo),
Tadeusiewicz Ryszard (Akademia Górniczo-Hutnicza w Krakowie)

Redaktor językowy: Agnieszka Wagner

Redaktor techniczny: Mariusz Owsianny

Zakres tematyczny

Prace publikowane w roczniku poruszają zagadnienia z następujących dziedzin:

  • technologii i przetwarzania mowy i języka (włączając syntezę i rozpoznawanie mowy),
  • szeroko pojętej lingwistyki,
  • fonetyki, produkcji, percepcji i akustyki mowy,
  • prozodii,
  • nauczania języków obcych (szczególnie w odniesieniu do wymowy i prozodii),
  • fonetyki w zastosowaniach medycznych oraz
  • zasobów językowych (w odniesieniu do tworzenia i anotacji korpusów, leksykonów)

Informacje dla autorów

Wszystkich zainteresowanych opublikowaniem w SLT wyników prowadzonych badań prosimy o nadsyłanie prac na adres mailowy ptfon@ptfon.pl.
Artykuły powinny mieć objętość między 12-20 stron, tj. 3500-6500 wyrazów nie licząc bibliografii, w tym streszczenie w języku polskim i angielskim na ok. 200-300 słów. Prace należy przesłać w odpowiednim formacie - szablon dostępny jest tutaj.

Recenzenci

Izdebski Krzysztof (Santa Clara University, Pacific Voice and Speech Foundation, USA),
Andrzej Izworski (Akademia Górniczo-Hutnicza w Krakowie),
Krzysztof Jassem(Uniwersytet im. Adama Mickiewicz w Poznaniu),
Ela Thurgood (California State University),
Piotr Wierzchon (Uniwersytet im. Adama Mickiewicz w Poznaniu),
Wieslaw Wszolek (Akademia Górniczo-Hutnicza w Krakowie)

Zasady recenzowania

  • do oceny każdej publikacji powołuje się, co najmniej dwóch niezależnych recenzentów spoza jednostki naukowej afiliowanej przez autora publikacji

  • autor lub autorzy publikacji i recenzenci nie znają swoich tożsamości (double-blind review process)
  • pisemna recenzja zawiera jednoznaczny wniosek recenzenta dotyczący warunków dopuszczenia artykułu naukowego do publikacji lub jego odrzucenia
  • formularz recenzji, na podstawie którego recenzenci dokonują oceny artykułu jest dostępny tutaj
  • nazwiska recenzentów poszczególnych publikacji lub numerów wydań czasopisma naukowego nie są ujawniane

Deklaracja o wersji pierwotnej

Wersją pierwotną rocznika SPEECH AND LANGUAGE TECHNOLOGY jest wersja drukowana.

Aktualny tom i poprzednie wydania:

Aby pobrać najnowszy tom SLT vol. 14/15 kliknij tutaj.

Osoby zainteresowane dostępem do artykułów z poprzednich wydań proszone są o kontakt z redakcją (e-mail: ptfon@ptfon.pl).

Aby przejrzeć zawartość wybranego rocznika należy wybrać link z listy poniżej:


Informacje o zawartości tomów 7 i 8 oraz wybrane artykuły udostępniamy na życzenie osób zainteresowanych.


vol. 14/15 (2011/2012), wydanie bieżące

Część 1: Aplikacje

Modelowanie intonacji dla syntezy mowy neutralnej
Grażyna Demenko, Tomasz Kuczmarski

Przegląd metod w syntezie mowy opartej na niejawnych modelach Markowa
Tomasz Kuczmarski

Ewaluacja mowy syntetycznej za pomocą automatycznego rozpoznawania mowy z modelem adaptowanym do mówcy
Jolanta Bachan, Tomasz Kuczmarski i Piotr Francuzik

Ewaluacja systemu rozpoznawania mowy polskiej
Mariusz Owsianny, Piotr Francuzik

Część 2: Zasoby i narzędzia

Zastosowanie bazy “Paralingua” do badania stanów afektywnych i cech para lingwistycznych
Katarzyna Klessa, Agnieszka Wagner, Magdalena Oleśkowicz-Popiel

Wstępna ocena bazy nagrań mowy pod wpływem alkoholu
Małgorzata Zagrodnicka

Zgodność anotacji segmentalnej i prozodycznej w polskiej bazie Jurisdict
Marcin Szymański, Jolanta Bachan

Skuteczność programów dopasowujących angielsko-polskie teksty równoległe na poziomie zdania
Grzegorz Krynicki

Część 3: Analiza

Intonacja pytań w koreańskich i polskich dialogach zadaniowych
Analiza mowy spontanicznej z wykorzystaniem modelowania percepcyjnego

Maciej Karpiński, Emilia Szalkowska-Kim

Akustyczna realizacja długich dyftongów w Hainan Cham
Ela Thurgood

Produkcja i percepcja mowy emocjonalnej w języku polskim: ramy analizy
Agnieszka Wagner

powrót

vol. 14/15 (2011/2012), wydanie specjalne, jubileuszowe

Part 1: Methodology (Metodologia)

Empirical models of tone, rhythm and intonation for the analysis of speech prosody (Empiryczne modele tonu, rytmu i intonacji do analizy prozodii mowy)
Daniel Hirst

Formal models of oscillation in rhythm, melody and harmony (Formalne modele oscylacji w rytmie, melodii i harmonii)
Dafydd Gibbon

Timing in conversations: from speech synthesis to robot interaction (Wzorce czasowe w konwersacjach: od syntezy mowy do interakcji z robotem
Nick Campbell

Intonation processing for speech technology (Przetwarzanie intonacji dla technologii mowy)
Grażyna Demenko

powrót

Part 2: Rhythm - duration and timing (Rytm - iloczas i wzorce czasowe)

From research to application: creating and applying models of British RP English rhythm and intonation (Od badań do aplikacji: tworzenie i zastosowanie modeli rytmu i intonacji języka angielskiego brytyjskiego)
David Hill

Rhythm in L2 speech (Rytm w mowie L2)
Ulrike Gut

Polish segmental duration: selected observations based on corpus data (Iloczas głoskowy w języku polskim: obserwacje wybrane w oparciu o dane korpusowe)
Katarzyna Klessa

Acoustic-phonetic realisation of Polish syllable prominence: a corpus study (Akustyczno-fonetyczna realizacja wzmocnienia polskiej sylaby: korpusowe badanie mowy spontanicznej)
Zofia Malisz and Petra Wagner

powrót

Part 3: Melody - intonation and pitch (Melodia - intonacja i wysokość tonu)

An analysis of laryngeal aperture regulation in relation to larynx height change using simultaneous laryngoscopy and laryngeal ultrasound (Analiza regulacji otwarcia względem wysokości krtani z wykorzystaniem jednoczesnej laryngoskopii i ultradźwiękowego obrazowania krtani)
John Esling and Scott R Moisik

Absolute pitch: an unusual type of memory for standard musical scale (Słuch absolutny: niezwykły rodzaj pamięci dotyczący standardowej skali muzycznej)
Andrzej Rakowski

Tones in tunes: a preliminary look at the realization of tone in Mambila song (Tony w melodiach: wstępna analiza realizacji tonu w śpiewie w języku mambila)
Bruce Connell

Acoustic properties and functions of phrase-final rises in Polish task-oriented dialogues (Własności akustyczne i funkcja końcowej melodii wznoszącej frazy intonacyjnej w polskich dialogach zadaniowych)
Maciej Karpiński

Automatic labeling of prosody (Automatyczna anotacja prozodii)
Agnieszka Wagner

powrót

Part 4: Harmony - segments in context (Harmonia - segmenty w kontekście)

NEUTRALIZATION.?! The phonetics-phonology issue in the analysis of word-final obstruent voicing (NEUTRALIZACJA.?! Zagadnienie fonetyki-fonologii w analizie dźwięczności wygłosowych obstruentów)
Klaus J. Kohler

Voicing of word-final obstruent in English connected speech (Dźwięczność wygłosowych obstruentów w mowie ciągłej w języku angielskim)
Wiktor Gonet

Acoustic cues to glottal stops in Polish-accented English (Akustyczne cechy wskazujące zwarcia krtaniowe w języku angielskim z polskim akcentem)
Anna Balas

Holistic perception of phonological variants (Holistyczna percepcja wariantów fonologicznych)
Linda Shockey and Zinny Bond

Israeli Hebrew and Hungarian interaction: phonetic/phonological Issues (Interakcja między współczesnym hebrajskim i węgierskim: zagadnienia fonetyczne/fonologiczne)
Judith Rosenhouse

powrót

Part 5: Biography and bibliography (Biografia i bibliografia)

Views and vita (Przemyślenia i życiorys)

Publications of Wiktor Jassem (Publikacje Wiktora Jassema)

powrót


vol. 12/13 (2009/2010)

Part 1: Phoniatrics (edited by Krzysztof Izdebski)

Integrated Spatio-Temporal Analysis of High-Speed Laryngeal Imaging and Acoustic Signals: Their Role and Applications in the Study of Normal and Abnormal Vocal Functions (Zintegrowana przestrzenno-czasowa analiza wysokoczułego obrazowania krtani i sygnałów akustycznych: ich rola i zastosowanie w badaniu prawidłowych i nieprawidłowych funkcji głosu)
Yuling Yan, Krzysztof Izdebski

Outcome of F0 determination using acoustic and electroglottographic algorithms (Wyniki wyznaczania F0 z wykorzystaniem algorytmów akustycznych i elektroglotograficznych)
Wiesław Wszołek, Maciej Kłaczyński

Expressive speech as a tool for human-computer interaction (Mowa ekspresywna jako narzędzie interakcji człowiek-komputer)
Grażyna Demenko

In search of a framework for speech emotion recognition (W poszukiwaniu ram koncepcyjnych dla rozpoznawania emocji w mowie)
Magdalena Jastrzębska

powrót

Part 2: Language processing (edited by Dafydd Gibbon)

A comparison of search algorithms for syntax-based statistical machine translation (Porównanie algorytmów wyszukiwania dla opartego na składni tłumaczenia maszynowego)
Marcin Junczys-Dowmunt

An attempt to automatically translate into the sign language emotionally colored textual utterances (Próba automatycznego tłumaczenia na język migowy emocjonalnie zabarwionych wypowiedzi tekstowych)
Julia Romaniuk, Nina Suszczańska, Przemysław Szmal

A sentence Clustering Algorithm for Specialized Translation Memories (Analiza skupień zdań na potrzeby wyspecjalizowanych pamięci tłumaczeń)
Rafał Jaworski

Classification of translation pairs for the purpose of creating domain dictionaries (Klasyfikacja par tłumaczeń dla tworzenia dużych słowników dziedzinowych)
Marcin Walas

Comparison of selected morphological analysers for Polish (Porównanie wybranych analizatorów morfologicznych dla języka polskiego)
Błażej Adamczyk

powrót

Part 3: Phonetics (edited by Elżbieta Thurgood)

Tonal variation in identical and conflicting contexts: A case study of Anong disyllabic utterances (Wariantywność tonalna w identycznych i sprzecznych kontekstach: studium dwusylabowych wypowiedzi języka Anong)
Ela Thurgood

Creation of the linguistic content for the pronunciation tutoring system AzAR 3.0 (Tworzenie zawartości językowej dla systemu do treningu wymowy AzAR 3.0)
Agnieszka Wagner, Natalia Cylwik

Prosodic inference with the ZDATR default inference engine (Prozodyczne wnioskowanie z domyślnym silnikiem wnioskowania ZDATR)
Dafydd Gibbon

powrót

Part 4: Speech synthesis and recognition (edited by Ryszard Tadeusiewicz)

SOM network for LVCSR Speech Recognition (Sieć SOM dla rozpoznawania mowy LVCSR)
Leszek Gajecki, Ryszard Tadeusiewicz
Speechlabs ASR. Polish Lexical Database for Speech Technology: Design and Architecture (Speechlabs ASR: Polska Leksykalna Baza Danych do zastosowań w technologii mowy. Projekt i architektura)
Katarzyna Klessa, Maciej Karpiński, Olga Bałdys, Grażyna Demenko

Speaker adaptation in speech recognition systems using neural networks (Adaptacja mówcy w systemach rozpoznawania mowy za pomocą sieci neuronowych)
Michał Dyrek

HMM-based Speech Synthesis Applied to Polish (System syntezy mowy oparty na ukrytych modelach Markowa
dla języka polskiego)

Tomasz Kuczmarski

Tools for automatisation of voice creation for diphone based speech synthesis (Narzędzia do automatyzacji tworzenia głosów dla difonowej syntezy mowy)
Jolanta Bachan

powrót

Part 5: Reports and technical papers (edited by Zbigniew Rau)

Speech perception and the application of automatic speech recognition system for the recording of testimonies
made in the course of court proceedings

Anna Demenko

Human voice as a right protected by the law
Jakub Dąbrowski

Automatic speech recognition systems (ASRS) in homeland security systems – their use in
police operations

Zbigniew Rau, Dariusz Pilarczyk

Technologies of processing and recognition of verbal information in homeland security systems (Technologie przetwarzania oraz rozpoznawania informacji słownych w systemach bezpieczeństwa wewnętrznego)
Grażyna Demenko, Stefan Grocholewski

powrót

vol. 11 (2008)

Part 1: Speech and speaker recognition

Modeling of man auditory system as a method for automatic speech recognition systems improvement (Modelowanie systemu słuchowego człowieka jako metoda doskonalenia systemów automatycznego rozpoznawania mowy)
Ryszard Tadeusiewicz

Acoustical parameters of target voices and their imitators
Wojciech Majewski and Piotr Staroniewicz

First evaluation of Polish LVCSR acoustic models obtained from the JURISDIC database
Marcin Szymański, Jerzy Ogórkiewicz, Marek Lange, Katarzyna Klessa,
Stefan Grocholewski, and Grażyna Demenko

An Investigation into the Intra- and Inter-labeller Agreement in the JURISDIC Database
Katarzyna Klessa and Jolanta Bachan

Telephony Based Voice Portal for a University
Łukasz Brocki, Danijel Koržinek, Krzysztof Marasek

The system architecture of a speech database via the WWW (Baza nagrań głosowych z dostępem poprzez Internet)
Andrzej Izworski, Piotr Pracuch, Jarosław Bułka, and Ireneusz Wochlik

Modeling of Polish language for Large Vocabulary Continuous Speech Recognition (Modelowanie języka polskiego dla ciągłego rozpoznawania mowy z uwzględnieniem obszernego zakresu słownictwa)
Leszek Gajecki and Ryszard Tadeusiewicz

powrót

Part 2: Speech analysis and synthesis

Synthesis of F0contours for Mandarin speech by superposing corpus-generated tone contours on rule-generated phrase components
Keikichi Hirose, Qinghua Sun, and Nobuaki Minematsu

The design of Polish Speech Corpus for Unit Selection Speech Synthesis
Grażyna Demenko, Bernd Möbius, and Katarzyna Klessa

A Model of Personalized Audio-Visual TTS-synthesis for Russian
B. Lobanov, L. Tsirulnik, A. Ronzhin, and A. Karpov

Preliminary Results of Expressive Speech Synthesis in Polish
Jolanta Bachan and Barbara Surmanowicz

Aspects of gestural and prosodic structure of multimodal utterances in Polish task-oriented dialogues
Maciej Karpiński, Ewa Jarmołowicz-Nowikow, and Zofia Malisz

The use of CALL in acquiring foreign language pronunciation and prosody – General specifications for Euronounce Project
N. Cylwik, G. Demenko, O. Jokisch, R. Jäckel, M. Rusko, R. Hoffmann, A. Ronzhin, D. Hirschfeld, U. Koloska, and L. Hanisch

An acoustic database gathered for the purpose of creating a detector of selected pronunciation errors appearing in English spoken by Poles (Akustyczna baza danych zgromadzona na potrzeby układu detekcji wybranych błędów wymowy w mowie angielskiej Polaków)
Grzegorz Krynicki, Dawid Pietrala, Katarzyna Dziubalska-Kołaczyk, Mikołaj Wypych

Automatic assessment of distortions in isolated sounds in dysarthia disease (Automatyczna ocena zaburzeń realizacji głosek w dyzartrii)
Tomasz Orzechowski, Katarzyna Chmurzyńska, Piotr Radkowski, Andrzej Izworski

Computational tools in the analysis of phonetic grammar
Krzysztof Dyczkowski, Norbert Kordek, Paweł Nowakowski, and Krzysztof Stroński

powrót

Part 3: Language processing

English grapheme-to-phoneme conversion and evaluation
Uwe Reichel, Hartmut R. Pfitzinger, and Horst-Udo Hain

Automatic correction of part-of-speech corpora
Uwe Reichel, Lia Saki Bucar Shigemori

Semantic Modelling for Speech Recognition
Bartosz Ziółko, Suresh Manandhar, Richard C. Wilson, and Mariusz Ziółko

Problems of Disambiguation in the Thetos-3 System
Nina Suszczańska, Przemysław Szmal

Corpora based Approach for Arabic/English Word Translation Disambiguation
Farag Ahmed and Andreas Nürnberger

Overcoming Agglutination Difficulties in the Development of an MT system from the Azerbaijani Language
Rauf Fatullayev, Ali Abbasov, and Abulfat Fatullayev

A Linguistically Light Approach to Multilingualism in Lexical Layers for Ontologies
Alexander Troussov, John Judge, Mikhail Sogrin, Amine Akrout, Brian Davis, and Siegfried Handschuh

SuperMatrix: A General Tool for Lexical Semantic Knowledge Acquisition
Bartosz Broda and Maciej Piasecki

Modeling the Frequency of Phrasal Verbs with Search Engines
Grażyna Chamielec and Dawid Weiss

SemCAPTCHA - the user-friendly alternative for OCR-based CAPTCHA systems
Paweł Łupkowski and Mariusz Urbański

powrót


vol. 9/10 (2006/2007)

Part 1: Phonetics and Phonology (Fonetyka i Fonologia)

Homophones in Polish (Polskie homofony)
Maria Steffen-Batóg, Tadeusz Batóg

Disfluencies in Polish and Thai task-oriented dialogue (Zaburzenia płynności w polskich i tajskich dialogach zadaniowych)
Janusz Kleśta, Maciej Karpiński

A set of speech perception tests for children with cochlear implants – preliminary evaluation (Zestaw testów percepcyjnych mowy dla dzieci z implantami ślimakowymi – wstępna ewaluacja)
Jerzy Ogórkiewicz, Jolanta Bachan, Małgorzata Mazur, Mariusz Owsianny, Dariusz Komar, Grażyna Demenko

Elliptic sentences processing in the Thetos translation system (Przetwarzanie zdań eliptycznych w systemie tłumaczącym Thetos)
Nina Suszczańska, Julia Romaniuk, Przemysław Szmal

powrót

Part 2: Prosodic Analysis (Analiza Prozodyczna)

Prosody of Hungarian Imperative Sentences (Prozodia węgierskich zdań rozkazujących)
Ilona Koutny

Prosodic features in simultaneous interpreting (Cechy prozodyczne w tłumaczeniu symultanicznym)
Natalia Cylwik

Sentence Intonation for Polish Language (Prozodia wypowiedzi w języku polskim)
Bożena Piorkówska, Janusz Rafałko, Wojciech Lesiński, Edward Szpilewski

A Study of Chosen Temporal Relations within Syllable Structure in Polish (Analiza wybranych związków iloczasowych zachodzących w obrębie sylaby w języku polskim)
Katarzyna Klessa, Daniel Śledziński

powrót

Part 3: Speech synthesis and speech recognition (Synteza i Rozpoznawanie Mowy)

Study of Idiosyncrasy of Syntagmatic Segmentation for Personal Speaking Manner Cloning by TTS
Boris Lobanov, Liliya Tsirulnik, Anatoly Fiodorov

Talking blogs – an attempt to give weblogs a voice Adding TTS functionality to Wordpress
Arne Hellmich

Automatic Close Copy Speech Synthesis (Synteza mowy metodą automatycznego dokładnego kopiowania)
Jolanta Bachan

The role of discourse markers in the synthesis of Hungarian prosody (Rola markerów dyskursu w syntezie prozodii węgierskiej)
Ilona Koutny

Building speaker identification systgem using Hidden Markov Model Toolkit (Rozpoznawanie mówców przy pomocy zestawu narzędzi HTK)
Marek Lange

Semi-automatic segmentation of speech: manual segmentation strategy based on error prediction (Pół-automatyczna segmentacja nagrań mowy: strategia segmentacji ręcznej w oparciu o predykcję błędu
Marcin Szymański and Stefan Grocholewski

The use of statistics of Polish phonemes in speech Recognition (Zastosowanie statystyk fonemów języka polskiego w rozpoznawaniu mowy)
Bartosz Ziółko, Jakub Gałka, Suresh Manandhar, Richard C. Wilson, Mariusz Ziółko

Building lexica for application in a speech dictation system (Tworzenie leksykonów do zastosowania w systemie dyktowania mowy)
Agnieszka Wagner, Grażyna Demenko

Acoustical Analysis of the Polish Syllables for Needs of the Speech Technology (Analiza cech akustycznych sylab języka polskiego na potrzeby technologii mowy)
Daniel Śledziński

The evaluation of recordings’ quality in the database created for the automatic speech recognition system (Ocena jakości nagrań w bazie danych dla systemu rozpoznawania mowy)
Daniel Śledziński

powrót