SkryBot
przewijanie
przewijanie

 

 

 

skrybot rozpoznawanie mowy logo

 

Instrukcja
obsługi

SkryBot Do Mowy od 2.4.8.17045

Spis treści

1          Przeznaczenie programu SkryBot 3

2          Wymagania systemowe. 5

3          Instalacja SkryBota. 6

4          Przed uruchomieniem SkryBota. 7

5          Pierwsze uruchomienie SkryBota. 8

6          Okno główne SkryBota. 12

7          Konfiguracja mikrofonu i kalibracja mowy. 14

7.1        Ustawienie dźwięku. 14

7.2        Ustawienia dźwięku w systemie Windows. 17

7.3        Regulacja dźwięku w głównym oknie SkryBota. 18

8          Konfiguracja SkryBota. 19

8.1        Konfiguracja główna. 19

8.2        Instrukcja. 21

8.3        Skróty klawiszowe. 21

8.4        Denormalizacja. 22

9          Rozpoznawanie mowy SkryBotem.. 23

9.1        Rozpoznawanie stałe. 23

9.2        Rozpoznawanie przerywane (najpierw nagranie, potem rozpoznawanie – na przemian) 23

9.3        Rozpoznawanie z plików nagranych SkryBotem (dyktafon SkryBota) 23

10       Rozpoznawanie z plików.. 24

11       Jak osiągnąć najlepsze rezultaty rozpoznawania. 28

12       Tryb komend. 29

13       Tryb wyszukiwania słów/fraz. 30

14       Tyb prezentacji 33

15       Aktualizacja SkryBota. 37

16       Wielokanałowe nagrywanie i rozpoznawanie SkryBotem.. 38

17       Wyłączenie SkryBota. 39

18       Informacje dodatkowe. 40

19       Wiadomości RSS. 41

20       Wysyłanie plików do Przepisywanie.pl 42

21       Własność oprogramowania. 43

 

Zastrzeżenie:

Funkcjonalności oprogramowania SkryBot mogą się zmienić bez uprzedzenia o tym aktualnych użytkowników, dlatego nie gwarantujemy, że w każdej chwili instrukcja będzie w 100% zgodna z opcjami dostępnymi w oprogramowaniu.

1          Przeznaczenie programu SkryBot

Podstawowym przeznaczeniem SkryBota jest zamiana mowy na tekst:

·      z mikrofonu,

·      z plików (wyłączone w wersji bezpłatnej).

SkryBot rozpoznaje mowę dyktowaną w obszarze słownictwa zgodnego ze słownikiem zakupionej wersji i zamienia ją na tekst. Oznacza to, że gdy użytkownik mówi do mikrofonu lub wskazuje plik z gotowym nagraniem, jego mowa jest zamieniana na tekst. Podstawowym narzędziem służącym do zamiany mowy na tekst jest słownik SkryBota. Jeśli wypowiedziane słowa nie są zawarte w słowniku
lub tor nagrywania mowy został zakłócony, SkryBot wstawi inne podobnie brzmiące wyrazy.

W przypadku wyższych wymagań odnośnie dokładności rozpoznawania mowy w bardziej wymagającym środowisku jak rozmowy telefoniczne, wymagane jest wykonanie indywidualnej kalibracji programu SkryBot i korzystanie z wersji serwerowej, jednak może się to wiązać z wyższymi kosztami wstępnymi przygotowania systemu rozpoznawania.

Dokładność rozpoznawania mowy SkryBot podczas zamiany mowy na tekst z nagrań rozmów przeprowadzanych z ukrycia, konferencji, wywiadów będzie zmniejszona jeśli:

·       mowa jest nagrana niewyraźnie oraz zbyt cicho lub za głośno,

·       w trakcie rozmów osoby wchodzą sobie w słowo, co uniemożliwia wyizolowanie próbki dźwięku nadającej się do identyfikacji
przez SkryBota;

·       często pojawiają się wtręty typu eee yyy, co utrudnia rozpoznanie mowy, a czasem wręcz uniemożliwia;

·       Należy zwrócić uwagę na jakość nagrania. Aby nagrywać prawidłowo należy zaopatrzyć uczestników w mikrofony umożliwiające uzyskanie indywidualnego nagrania głosu pojedynczej osoby, zapewnić właściwą akustykę pomieszczenia oraz zminimalizować szumy zakłócające nagranie;

·       UWAGA: Ogólnodostępne oprogramowanie SkryBot nie zawiera słownika dostosowanego akustycznie do tego słabej jakości nagrań. Kalibracja SkryBota dla zwiększenia dokładności rozpoznawania w takich przypadkach jest wykonywana indywidualnie na zamówienie dla firm. 

Zalecany sposoby korzystania ze SkryBota podczas zamiany mowy na tekst rozmów wielu osób lub dla nagrań gorszej jakości:
1. odsłuchiwanie i dyktowanie-powtarzanie, tego co się słyszy w słuchawkach własną mową do dyktafonu SkryBota (przycisk Nagrywaj / Nie rozpoznawajczyli „przepisywania nagrań mową”. Dyktafon SkryBota ma możliwość pauzowania nagrywania dlatego można utworzyć w ten sposób plik, który potem zostanie przepisany automatycznie, lub korzystamy z funkcji rozpoznawania na bieżąco (przycisk Nagrywaj / Rozpoznawaj lub przycisk Rozpoznawaj stale). Czyli odsłuchujemy fragmentami nagranie i dyktujemy
usłyszaną treść.
2. można zastosować wielokanałowe nagrywanie z pełną separacją sygnału (
rozdział 17 Wielokanałowe nagrywanie i rozpoznawanie SkryBotem).

Uwaga: Jeśli dyktowane słownictwo będzie wykraczało poza zasoby licencjonowanego słownika SkryBota, to nagrane wyrazy zostaną zamienione na słowa brzmiące podobnie fonetycznie.

Dostępne są wersje SkryBota z wbudowanym słownikiem dostosowanym do pracy z tekstami prawniczymi, administracyjnymi oraz medycznymi. Więcej informacji na ten temat można znaleźć na stronie SkryBot.pl.

 

Wymagania systemowe

Aby program SkryBot mógł działać poprawnie, komputer, na którym użytkownik planuje go zainstalować, powinien spełniać poniższe wymagania:

1. System operacyjny: Windows 10; 8.1; 8; 7; Vista; 32 i 64 bit,

2. Procesor: minimalnie 2 GHz,

3. Minimum 3 GB RAM,

4. Połączenie internetowe,

5. Karta dźwiękowa oraz zewnętrzny mikrofon,

6. Odpowiednia ilość wolnej przestrzeni dyskowej HDD,

7. Zainstalowane najnowsze poprawki Microsoft z aplikacji Windows Update. Niektóre stare wersje systemów operacyjnych Windows 7 bez aktualizacji nie uruchomią SkryBota.

Zalecana konfiguracja: procesor i7 z taktowaniem powyżej 3 GHz, od generacji 7-mej; 4 GB RAM oraz instalacja wszelkich niezbędnych aktualizacji systemu.

Instalacja SkryBota

Oprogramowanie jest przeznaczone dla systemów Windows Vista;7; 8; 8.1; 10 itd. oraz wersji serwerowych Windows od 2008. Jednakże wersja desktop SkryBota nie jest tożsama z wersją serwerową, która ze względu na jej wyższą cenę jest skierowana do klientów biznesowych i instytucjonalnych.

1. Ściągnij oprogramowanie w dowolne wybrane miejsce na dysku lokalnym. Pamiętaj, że w zależności od rodzaju wersji SkryBota, musisz mieć odpowiednią ilość wolnego miejsca na dysku i wolnej pamięci RAM. Program systematycznie zajmuje coraz więcej miejsca na dysku, zapisując nowe nagrania i teksty. Domyślna lokacja plików tworzonych w trakcie uruchomienia SkryBota to C:\Skrybot\Results, którą można zmienić w ustawieniach, 

2.    Uruchom plik instalatora: InstalatorSkrybotDoMowy<numerWersji>.exe, 

3.    Przeczytaj i jeżeli chcesz kontynuować, to zaakceptuj licencję. Przejdź przez wszystkie kroki instalacji klikając Dalej. W trakcie instalacji mogą zostać zainstalowane niezbędne dodatkowe składniki oprogramowania (np. .Net Framework 4.6 oraz C/C++ Runtime environment), 

4.   Niektóre programy antywirusowe zgłaszają rzekome problemy. Wynika to ze sposobu komunikacji pomiędzy dekoderem mowy, a głównym interfejsem użytkownika. Komunikacja ta odbywa się przez tzw. gniazdka TCP/IP. Do tego dochodzi również ‘wstrzykiwanie’ tekstu do innych programów. Ostrzeżenia antywirusa należy zignorować i upewnić się, że zapora ogniowa ‘firewall’ nie blokuje dostępu programom Skrybot.App.exe oraz Skrybot.Decoder.Server.exe.

5.    Po instalacji, dla oszczędności miejsca na dysku, możesz usunąć ściągnięte archiwum SkryBota oraz rozpakowany folder.

6.    SkryBot zainstaluje się w C:\Program Files\Skrysoft\Skrybot *\ (systemy 32bit) lub C:\Program Files (x86)\ Skrysoft\Skrybot *\ (systemy 64bit). Pliki z nagrywaną mową i tekstem będą się zapisywać w katalogu: C:\Skrybot\Results.

 

Wskazówka:

Poprzednią wersję SkryBota z takim samym słownikiem, przed instalacją nowszej wersji, zalecamy  ODINSTALOWAĆ / USUNĄĆ . W
przeciwnym przypadku może nastąpić konflikt
uniemożliwiający poprawne działanie programu. Aktualizacja sama przeprowadzi odpowiednie procesy lub poinformuje co zrobić.

Uwaga:

W niektórych przypadkach, przy pierwszym uruchomieniu SkryBota, Należy potwierdzić wyjątek bezpieczeństwa, wyłączyć Antywirusa, Ochronę Windows, inny Firewall lub dodać SkryBota do wyjątków Ochrony Windows.

Uwaga:

Zdarza się, że bezpłatne programy antywirusowe (dotyczy to niektórych programów budowanych przez społeczność Open Source) dają fałszywe wyniki testu antywirusowego w odniesieniu do SkryBota. SkryBot ściągany ze https://SkryBot.pl  i https://sf.net/p/skrybotdomowy oraz stron współpracujących: komputer świat, programosy, instalki, dobre programy – na pewno nie zawiera wirusów.

4          Przed uruchomieniem SkryBota

Aby używać oprogramowania do zamiany mowy na tekst SkryBot, należy posiadać:

1.    komputer z zainstalowanym systemem z rodziny Windows: Vista, 7; 8; 8,1; 10; Windows Server od 2008; 

2.    zainstalowaną prawidłowo kartę dźwiękową; 

3.    podłączony mikrofon (najlepiej nagłowny z wtyczką USB) – nie jest potrzebny, jeśli dekodujesz z plików.

W pracy ze SkryBotem bardzo dobrze sprawdzają się są różnego rodzaju mikrofony ze słuchawkami do telefonów, ale jeśli mają wyjście jack 3,5 mm (Rys.1), powinny być podłączone za pomocą karty dźwiękowej USB. 

Rys. 1   Mikrofony ze
słuchawkami do telefonów z wyjściem jack 3,5 mm

Lepsze efekty można uzyskać, używając mikrofonów ze słuchawkami  na złączu USB (Rys.2):
Sennheiser pc 7, Sennheiser pc 8; Logitech H390, 960; Plantronics Audio 345, Creative HS720, Plantronics 628 USB DSP i wiele innych.

 

Rys. 2   Mikrofony ze
słuchawkami na złączu USB

Jeśli masz „zwykły” mikrofon z wyjściem jack 3,5 mm, to jakość nagrywania można znacznie poprawić używając karty dźwiękowej na złączu USB (Rys.3).

 

Rys. 3   Karty
dźwiękowe na złączu USB

Jeśli nie masz uruchomionej karty dźwiękowej i mikrofonu, SkryBot wyświetli informację o tym lub przyciski nagrywania nie będą aktywne. Będzie działać tylko rozpoznawanie plików.

Kolejnym krokiem jest sprawdzenie czy mikrofon zainstalowany w systemie nagrywa dźwięk i czy poziom dźwięku jest właściwy. Podstawowym narzędziem do sprawdzenia jakości nagrywania może być SkryBot i jego opcja Konfiguracja / Ustawienia nagrywania / Nagrywanie i odtwarzanie. Dźwięk rejestrowany przez mikrofon wizualizowany jest w postaci oscylogramu. Prawidłowo skonfigurowany mikrofon rejestruje dźwięk oznaczony barwą zieloną. Wszelkie dźwięki o barwie czerwonej lub niebieskiej pogarszają jakość dekodowania mowy do tekstu. Czerwony kolor oznacza dźwięk zbyt głośny, a niebieski za cichy. Poziom czułości mikrofonu można dostosować za pomocą suwaka znajdującego się z lewej strony oscylogramu. Im niżej ustawiony zostanie suwak, tym mniejsza będzie czułość mikrofonu na docierające do niego dźwięki.

Zaleca się każdorazowe odsłuchanie nagrania dla sprawdzenia jego poprawności. Pliki z nagraniem zapisywane są w folderze C:\SkryBot\results.

 

5          Pierwsze uruchomienie SkryBota

Kliknij dwukrotnie ikonę SkryBota na pulpicie lub w folderze instalacyjnym.

SkryBota można również uruchomić z katalogu C:\Program Files(86)\Skrysoft\Skrybot *    poprzez plik Skrybot.App.exe.

Przy pierwszym uruchomieniu po instalacji, pojawi okno do wpisania numeru licencji.

W oknie tym należy wkleić lub wpisać numer licencji otrzymanej w e-mailu. Po kliknięciu przycisku Zastosuj, SkryBot sprawdzi czy podany numer licencji jest prawidłowy. Postęp i czas trwania tego procesu można obserwować na ekranie.

 

Rys. 4   Okno
weryfikacji licencji

Zakup pojedynczej licencji SkryBota uprawnia do uruchomienia go na maksymalnie trzech[1] komputerach.

Licencja pozwala na korzystanie z aktualizacji i poprawiania jakości rozpoznawania przez rok od momentu zakupu.

Przedłużanie aktualizacji jest dostępne w promocyjnych cenach, gdy abonament na aktualizację jest kontynuowany przed wygaśnięciem rocznej licencji. Aktualizacje można przedłużyć na kilka lat w promocyjnej cenie za niewielki procent wartości podstawowej wersji programu.

SkryBot przy pierwszym uruchomieniu połączy się z serwerem licencji i sprawdzi ważność licencji. Ważność licencji można przedłużyć. Należy pamiętać, że jest to niezbędne dla dostępu do aktualizacji, poprawiania rozpoznawania i rozbudowy słownika. SkryBot uruchamia się, jeżeli wpisana licencja jest aktualna lub nie została zablokowana ze względu na upływ terminu ważności. Dlatego aby uruchomić SkryBota po raz pierwszy, należy mieć działające połączenie z internetem. Takie same są wymagania podczas uruchamiania aktualizacji, poprawiania rozpoznawania i zmiany słownika.

Należy pamiętać, aby nie udostępniać własnego klucza osobom trzecim, gdyż użycie go przez inną osobę zmniejszy maksymalny limit komputerów (trzy), na których można uruchomić własnego SkryBota.

Po zaakceptowaniu numeru licencji, otworzy się okno informacyjne SkryBota – tzw. ekran powitalny (Rys.5).

 

Rys. 5   Okno
informacyjne SkryBota

W oknie informacyjnym SkryBota można wykonać następujące działania:

1.     Kliknąć Mikrofon, aby przejść do ustawienia poziomu nagrywania mikrofonu i wybrać właściwy mikrofon, jeśli w systemie jest więcej niż jedno urządzenie. Zwiększanie wydajności nie jest obecnie wspierane. Jeśli karta dźwiękowa ma tę opcję ustaw zwiększenie wydajności w systemie).

2.     Kliknąć Kalibracja Mowy – aby zoptymalizować ustawienia dźwięku.

3.    Opcjonalnie kliknąć pole wyboru, aby to okno nie pojawiało się w przyszłości.

4.    Kliknąć English –  aby zmienić język interfejsu z polskiego na angielski.

5.    Zamknąć – po kliknięciu na Zamknij przejdziesz do okna głównego.

 

Jeśli mikrofon jest prawidłowo podłączony wyświetli się w oknie: Mikrofon/ Ustawienia Nagrywania / Urządzenia lub Konfiguracja/ Ustawienia Nagrywania / Urządzenia.  Aby wybrać mikrofon wystarczy raz kliknąć w linię z nazwą urządzenia. Analogicznie należy postąpić z urządzeniem odtwarzającym.

 

Rys. 6   Ustawienia
Nagrywania

6          Okno główne SkryBota

 Okno główne (Rys.7) pozwala na dostęp do najważniejszych funkcji programu SkryBot. Przyciski dostępne w tym oknie służą do rozpoznawania mowy w różnych trybach. Zostały one omówione w rozdziale 9 Rozpoznawanie mowy SkryBotem.

W celu jak najlepszej kontroli nad procesem nagrywania i dekodowania mowy na tekst, w oknie głównym SkryBota dostępne są informacje na temat: urządzenia nagrywającego, odtwarzającego, bieżącego statusu dekodera oraz statusu nagrywania i jego postępu.

 

Rys. 7   Okno główne SkryBota

Dla pełnej kontroli długości procesu rozpoznawania, w trakcie dekodowania (w prawym górnym rogu okna) wyświetla się porównanie szybkości dekodowania do realnego czasu (RT). Jeśli wartość jest wyższa od 1, oznacza że czas dekodowania będzie krótszy niż długość pliku, a wydajność komputera jest wysoka.

W lewym dolnym rogu okna, dostępne są informacje o kolejnych krokach wykonanych przez program SkryBot, w celu zdekodowania mowy. Informacje bezpośrednio dotyczące pracy dekodera mowy zostały oddzielone od Informacji Ogólnych, poprzez umieszczenie ich w zakładce Dekoder.

Prawa część okna głównego, to edytor tekstu, do którego można wklejać własny tekst (np. gdy chcemy go przedyktować i wykorzystać do Poprawiania rozpoznawania). Głównym przeznaczeniem tego edytora jest jednak umożliwienie użytkownikowi bieżącej kontroli nad wynikami dekodera. W oknie tym będzie pojawiał się tekst, będący wynikiem procesu dekodowania mowy. Po zakończeniu dekodowania tekst, który wyświetli się w oknie edytora, można poddać korekcie, a następnie zapisać w formacie .rtf lub .txt

Wybór zakładki Edycja na bieżąco pozwala na wyświetlenie w oknie edytora, tekstu zdekodowanego przy użyciu przycisków Nagrywaj / Rozpoznawaj oraz  Rozpoznawaj Stale. Tekst nie będzie zawierał znaczników czasu wystąpienia poszczególnych próbek nagrania, można jednak dla swojej wygody dostosować opcje dotyczące czcionki (rozmiar, rodzaj, kolor) układu tekstu oraz wkleić tekst bezpośrednio, wczytując plik tekstowy w formacie .rtf lub .txt. Test z edytora można również zapisać w obu tych formatach korzystając z przycisku Zapisz.

W zakładce Edycja z nagrania istnieje możliwość wyboru zdekodowanego już pliku nagrania. W tym miejscu zdekodowany plik przedstawiony jest w postaci zdań z określeniem dokładnego czasu ich pojawienia się w nagraniu. Plik można odsłuchać, korzystając z przycisków odtwarzacza, znajdującego się pod edytorem tekstu. Dostępna jest opcja przesłuchania pliku od dowolnie wybranej próbki
mowy, poprzez kliknięcie na nią, a następnie na zielony przycisk Start w odtwarzaczuMożna również wrócić do wybranego zdania w trakcie odsłuchiwania całości nagrania, poprzez kliknięcie na niego podczas odtwarzania pliku.

Dla ułatwienia śledzenia zdekodowanego tekstu w trakcie odtwarzania nagrania, należy wybrać opcję Ustaw poz. transkrypcji na podstawie audio w trakcie odtwarzania. W ten sposób bieżące zdanie z nagrania jest zaznaczane w transkrypcji poprzez podświetlenie go na niebiesko.

7          Konfiguracja mikrofonu i kalibracja mowy

7.1     Ustawienie dźwięku

W sterownikach dźwięku komputera należy wyłączyć nieużywane mikrofony. Klikając prawym przyciskiem na głośnik w zasobniku systemowym/ urządzenia nagrywania, można ustawić urządzenia do nagrywania w systemie, włączając i wyłączając odpowiednie mikrofony i wejścia dźwięku.

Do ustawień nagrywania można przejść na dwa sposoby:

1.   W oknie informacyjnym, pojawiającym się przy uruchomieniu SkryBota, należy kliknąć przycisk Mikrofon / Ustawienia nagrywania / Nagrywanie i odtwarzanie.

2.   W oknie głównym SkryBota należy wybrać Konfiguracja / Ustawienia nagrywania / Nagrywanie i Odtwarzanie  (Rys.8).

 

Następnym krokiem jest nagranie mowy i sprawdzenie czy nagrany dźwięk jest czysty i bez zakłóceń.

 

Rys. 8   Konfiguracja
mikrofonu

Dźwięk rejestrowany przez mikrofon wizualizowany jest w postaci oscylogramu. Prawidłowo skonfigurowany mikrofon rejestruje dźwięk oznaczony barwą zieloną. Wszelkie dźwięki o barwie czerwonej lub niebieskiej pogarszają jakość dekodowania mowy do tekstu. Dźwięk zbyt głośny zaznaczony jest w oscylogramie barwą czerwoną, a za cichy – niebieską. Do regulacji poziomu czułości mikrofonu służy suwak, znajdujący się z lewej strony oscylogramu. Im niżej ustawiony zostanie suwak, tym mniejsza będzie czułość mikrofonu na docierające
do niego dźwięki.

W oknie Kalibracji Mowy (Rys.9) należy stosować się do wskazówek wyświetlanych na ekranie. Rezultat pojawi się w dolnym oknie. Jeśli wynik testu jest prawidłowy kliknij Zastosuj. Jeśli test ma wynik nieprawidłowy, pozostaw ustawienia domyślne lub spróbuj ponownie przeprowadzić kalibrację.

 

Rys. 9   Okno automatycznej
Kalibracji Mowy

Dźwięk nagrany podczas procesu kalibracji można odtworzyć i odsłuchać.

Po wykonaniu automatycznej kalibracji mowy zalecamy przejście do menu Ustawienia Ręczne aby sprawdzić czy próg mowy został ustawiony na prawidłowym poziomie.

Zbyt nisko ustawiony próg mowy może powodować, że SkryBot będzie próbował rozpoznawać zakłócenia (szumy), które nie są mową. Spowolni to proces rozpoznawania i może doprowadzić do pojawienia się niepożądanych słów w rozpoznawanym tekście. Zbyt wysoki poziom progu mowy sprawi, że SkryBot zignoruje dźwięki, które będą istotne i części nagrania nie weźmie pod uwagę w procesie rozpoznawania – Rys.10a i 10b. Dźwięk, który zostanie poddany obróbce przez SkryBota jest przedstawiony w oknie po filtracji. Okno  przed filtracją  zawiera informacje o dźwięku rejestrowanym przez mikrofon.

Ustawienia ręczne pozwalają na samodzielne ustalenie progu mowy, czułości mikrofonu oraz parametrów dodatkowych:

1. Minimalna długość ciszy wiodącej,

2. Minimalna długość mowy,

3. Maksymalna długość mowy,

4. Minimalna długość ciszy kończącej.

 

SkryBot pracuje na zasadzie tworzenia kolekcji próbek dźwięku. Następnie mierzony jest ich czas trwania. Po przekroczeniu wskazanej, minimalnej długości mowy, próbka jest  powiększana o ciszę wiodącą (na początku próbki) i ciszę kończącą (na końcu próbki). 

Rysunek 10a Okno ręcznej
Kalibracji Mowy – prawidłowo ustawiony próg mowy

Rys. 10b  Okno ręcznej
Kalibracji Mowy – nieprawidłowo ustawiony próg mowy

7.2 Ustawienia dźwięku w systemie Windows

Po kliknięciu na ikonę głośnika w zasobniku systemowym, pojawią się pokazane poniżej opcje (Rys.11). Wybierz Urządzenia do nagrywania.

 

Rys. 11   Wybór
urządzenia do nagrywania dźwięku w komputerze

W panelu sterowania wybierz dźwięk (Rys.12 i uruchom jeden właściwy mikrofon (jeśli jest ich więcej w systemie). Sprawdź czy działa.

 

Rys. 12   Wybór
mikrofonu w panelu sterowania

7.3     Regulacja dźwięku w głównym oknie SkryBota

Regulacja czułości mikrofonu odbywa się za pomocą suwaka znajdującego się z lewej strony obszaru wizualizacji dźwięku(Rys.13).

 

Rys. 13  Ręczna
regulacja czułości mikrofonu

W głównym oknie programu dostępny jest stały podgląd na wizualizację nagrywanego dźwięku. Możesz dzięki temu również na bieżąco regulować i dostosowywać dźwięk.

BARDZO WAŻNE: Wizualizacja głośności nagrania z kontrolą czułości mikrofonu służy do ustawienia prawidłowej głośności nagrywanego dźwięku. Ważne jest, żeby dźwięk nie był zbyt cichy ani zbyt głośny (Rys.14).

 

Rys. 14   Przykładowe
wizualizacje nagrywanego dźwięku przy różnych ustawieniach czułości mikrofonu

Po ustawieniu głośności na właściwym poziomie, SkryBot jest gotowy do działania.

Konfiguracja SkryBota

Niektóre opcje konfiguracji zostały omówione w osobnych rozdziałach:

·
rozdział 7 Konfiguracja mikrofonu i kalibracja mowy

·
rozdział 13 Tryb komend  

Poniżej opisane zostały pozostałe funkcje dostępne dla użytkownika, w celu dostosowania SkryBota do swoich wymagań.

 

8.1     Konfiguracja główna

Możliwa jest pełniejsza konfiguracja ustawień. Aby jej dokonać należy po wejściu do okna Konfiguracji kliknąć przycisk Konfiguracja główna (Rys. 15) i dostosować opcje do swoich potrzeb i wymagań.

Rys. 15   Sposób
przejścia do konfiguracji głównej SkryBota

Okno Konfiguracji głównej  podzielone jest na trzy obszary:

1.
Ustawienia nagrywania – użytkownik może w tej części:

a.     samodzielnie zdefiniować folder docelowy dla zdekodowanych/nagranych plików oraz dla plików usuniętych,

b.    zmienić początek nazwy nagrywanych plików.

2.     Ustawienia ogólne dotyczą:

a.     wyglądu okna SkryBota

b.    języka interfejsu (zmiana języka interfejsu nie powoduje zmiany języka, w którym SkryBot rozpoznaje mowę, a jego zmiana wymaga zamknięcia i ponownego uruchomienia programu)

c.     formatu czcionki używanej w edytorze tekstu w oknie głównym,

d.    można też za pomocą pól wyboru włączyć lub wyłączyć opcje:

·      wyświetlania ekranu powitalnego,

·      uruchamiania SkryBota w formie zminimalizowanej,

·      zapisu danych po zakończeniu pracy z programem,

·      wiadomości RSS,

·      wyświetlania sugestii w pasku zadań,

·      automatycznego uruchomienia SkryBota przy starcie komputera,

·      automatycznego pisania z dużej litery,

·      zamykania SkryBota klasycznym sposobem, tj. klikając na X w prawym górnym rogu okna.

 

3.     Ustawienia dekodowania – tutaj użytkownik może określić:

a.     lokalizację szybkich i dokładnych ustawień dekodowania,

b.    mimimalną pewność komendy, czyli wyrażone w procentach prawdopodobieństwo rozpoznania komendy zgodnie z modelem zaprogramowanym w słowniku,

c.     minimalną pewność zdania – czyli wyrażone w procentach prawdopodobieństwo, że wypowiedziana fraza jest zgodna ze słownikiem SkryBota – dla wartości poniżej tego progu SkryBot wyświetli informację o odrzuceniu zdania,

d.    można również za pomocą pól wyboru włączyć lub wyłączyć opcje:

·       wstawiania tekstu do edytora tekstowego, np.: Word, Dyktak, itp.

·       dodawania daty na początku dekodowanego tekstu,

·       uruchamiania detekcji mowy automatycznie przy starcie,

·       usuwania nagrania po detekcji ciszy/mowy,

·       dodawania kropki na końcu frazy zidentyfikowanej jako koniec zdania,

·       dokładnego dekodowania (nie każdy tekst tego wymaga, a wyłączenie tej opcji pozwala na znaczne przyspieszenie procesu dekodowania mowy),

·       usunąć krótkie słowa w sytuacji, gdy występują pojedynczo lub towarzyszą komendom głosowym.

Dla wygody poruszania się w oknie Konfiguracji głównej, po najechaniu kursorem myszki na dostępną opcję modyfikacji ustawień, wyświetla się krótka informacja o tym, jaka funkcja SkryBota zostanie w ten sposób zmieniona.

 

Rys. 16   Okno
konfiguracji głównej SkryBota

8.2     Instrukcja

W przypadku jakichkolwiek wątpliwości dotyczących funkcjonalności SkryBota użytkownik ma zapewniony bezpośredni dostęp do Instrukcji. W celu otrzworzenia pliku z jej treścią należy kliknąć przycisk Instrukcja w zakładce Konfiguracja. 

Udostępniamy również filmy instruktażowe na kanale YouTube poświęconym SkryBotowi.

8.3     Skróty klawiszowe

Podstawowe funkcje można uruchamiać skrótami klawiszowymi. Zdefiniowane klawisze skrótu można przeglądać wybierając zakładkę Konfiguracja / Klawisze skrótu (Rys. 17). Oprócz korzystania z klawiszy skrótu już zdefiniowanych, użytkownik może sam zdefiniować skróty klawiszowe, które usprawnią poruszanie się w SkryBocie i dostosują go do jego indywidualnych potrzeb. 

Istnieje możliwość definiowania skrótów klawiszowych dla „akcji”, czyli wywołania konkretnego zachowania się programu, oraz dla wstawiania konkretnych wyrażeń, które są często stosowane i charakterystyczne dla danego użytkownika.

 

Rys. 17   Sposób
wyboru opcji Klawisze Skrótu oraz przykłady zdefiniowanych skrótów
klawiszowych

8.4     Denormalizacja

Przycisk Denormalizacja służy do podglądu dostępnych opcji denormalizacyjnych, czyli możliwości zamiany wypowiedzianych słów na skróty i symbole, jakie są powszechnie stosowane w tekście.

 

Rozpoznawanie mowy SkryBotem

9.1     Rozpoznawanie stałe

Przyciskiem Win+F9 albo klikając na przycisk Rozpoznawaj Stale uruchomia się ciągły tryb rozpoznawania. W tym trybie SkryBot stale nasłuchuje i rozpoznaje wszystkie dźwięki nagrywane mikrofonem, na bieżąco pokazując zdekodowaną mowę w oknie tekstowym.

9.2     Rozpoznawanie przerywane (najpierw nagranie, potem rozpoznawanie – na przemian)

Za pomocą skrótu Win+F4 lub klikając na przycisk Nagrywaj / Rozpoznawaj uruchamia się nagrywanie. Nagranie zostanie zakończone z chwilą ponownego kliknięcia przycisku lub skrótu klawiszowego Win+F4.Po zakończeniu nagrania SkryBot zamieni mowę na tekst. W tym trybie SkryBot nagrywa tylko gdy przycisk jest wciśnięty.

W wyniku działania tej funkcji w katalogu C:\Skrybot\results powstają pliki .wav (dźwięk) oraz .txt (tekst) i .xml (znaczniki czasowe i poziom ufności) oznaczone (dla ułatwienia identyfikacji) za pomocą daty oraz godziny nagrania.

Pliki .wav zawierają nagranie, plik .txt zawiera zdekodowany przez SkryBot tekst, natomiast w pliku .xml można znaleźć informacje o tym z jakim prawdopodobieństwem poszczególne słowa zostały rozpoznane przez program.

9.3     Rozpoznawanie z plików nagranych SkryBotem (dyktafon SkryBota)

Przycisk Nagrywaj / Nie rozpoznawaj oraz skrót Win+F3 pozwalają nagrywać mowę bez rozpoznawania. Nagranie można potem rozpoznawać używając funkcji Rozpoznawanie plików. Nagranie podczas odsłuchiwania plików audio np. rozmów i dyktowania, można pauzować  i wznawiać przyciskiem Pauza/Wznów. Dzięki temu wszystko zostanie nagrane w jednym pliku.

10 Rozpoznawanie z plików

SkryBot może rozpoznawać mowę, nawet gdy nie ma podłączonego mikrofonu. Do tego celu służy opcja rozpoznawania z plików. Pojedynczy plik poddany dekodowaniu nie może być dłuższy niż 10 minut.

W trakcie rozpoznawania mowy z plików nie należy korzystać z innych funkcjonalności SkryBota.

Uwaga: SkryBot rozpoznaje tylko pliki .wav 16 khz/16 bit mono. Aby SkryBot mógł dokonać zamiany pliku z zapisaną mową
na tekst, należy pliki mp3, mp4, wma przekonwertować za pomocą wbudowanego konwertera. Dotyczy to również plików
o końcówce .wav nienagranych SkryBotem. Wymienione wyżej pliki należy przekonwertować w zakładce Narzędzia / Rozpoznawanie Plików / Konwersja audio (Rys.18). Nowe pliki dostaną na koniec nazwy dopisek –16kHz.wav.

Jeśli chcesz rozpoznać odcinek nagrania, możesz nagranie przeciąć używając konwertera. Należy wybrać kratkę dzielenia pliku w konwerterze SkryBota i ustalić na jakie odcinki ma zostać podzielony. Dłuższe nagrania mogą zostać pocięte przez konwerter na ustalone odcinki.

Uwaga: nie każda wersja SkryBota oferuje cięcie plików.

Aby wybrać plik przeznaczony do konwersji należy użyć przycisku DODAJ DO LISTY. Następny krok to zaznaczenie kratki obok wybranego pliku i naciśnięcie przycisku KONWERTUJ. Pliki dodane omyłkowo można usunąć pojedynczo zaznaczając sąsiadujące z nim pole wyboru, a następnie klikając przycisk USUŃ Z LISTY .Można też usunąć wszystkie pliki znajdujące się w oknie PLIKI DO KONWERSJI za pomocą przycisku USUŃ WSZYSTKIE.

 

Rys. 18
Przeprowadzanie konwersji plików do formatu wymaganego przez SkryBota

Pozostałe nieobsługiwane formaty można konwertować m.in. bezpłatnym konwerterem ze strony www.dbpoweramp.com

Aby rozpoznawać pliki należy dodać je do DANYCH WEJŚCIOWYCH poprzez kliknięcie na przycisk Dodaj pliki do listy (Rys.19). Pliki dodane omyłkowo można usunąć pojedynczo, klikając przycisk Usuń wybrane lub zbiorowo za pomocą przycisku Usuń wszystkie. Po podwójnym kliknięciu na wybrany plik z górnej listy, można przesłuchać go, aby zdecydować, czy jest to nagranie, które chcemy dekodować. Do tego celu można również użyć ODTWARZACZA wbudowanego do tego modułu.

 

Rys. 19
Rozpoznawanie mowy z plików

Przetwarzanie pliku uruchamiane jest przyciskiem Rozpocznij przetwarzanie. Na ekranie pojawi się pasek postępu procesu przetwarzania oraz informacja o aktualnym statusie pliku (Rys.20):

·       Zakolejkowano, Rozpoczęto, Zakończono.

Uwaga: Należy pamiętać, że w zależności od długości pliku, trybu (dokładny / szybki) oraz szybkości komputera dekodowanie może zająć do paru godzin. Rozpoczęty proces można przerwać klikając na klawisz Stop.

Po zdekodowaniu pliku, w katalogu C:\Skrybot\results pojawi się plik z rozszerzeniem .txt o takiej samej nazwie jak plik .wav, który był dekodowany oraz plik .xml z czasami wstąpienia wyrazów. Jeśli w tekście pojawi się „odrzucenie zdania” oznacza to, że próg dopuszczalnego prawdopodobieństwa rozpoznawania fraz, był ustawiony na wyższą wartość niż uzyskana przez SkryBot w trakcie dekodowania.

 

Rys. 20   Przebieg
procesu dekodowania mowy z plików

Innymi słowy: rozpoznana fraza została uznana za mało prawdopodobną, a tym samym niezgodną z oczekiwaniem użytkownika. Powodem zaistnienia takiej sytuacji może być również brak danego słowa w słowniku SkryBota, niewyraźna mowa lub zakłócenia zarejestrowane w danej próbce nagrania, uniemożliwiające poprawną identyfikację dźwięków. W zależności od powodu „odrzucenia zdania” użytkownik może:

1.
ponownie nagrać mowę (tym razem bez zakłóceń) i poddać prawidłowe nagranie procesowi dekodowania,

2.     zmniejszyć próg zdefiniowanego prawdopodobieństwa (Konfiguracja Główna) i poddać nagranie dekodowaniu raz jeszcze,

3.
ręcznie edytować rozpoznany tekst wpisując poprawne słowo (w sytuacji gdy słownik SkryBota go nie zawiera).

 

Podsumowując:

1. Pojedynczy dekodowany plik nie może mieć więcej niż 10 minut. Dłuższe nagrania należy najpierw przekonwertować konwerterem, który automatycznie podzieli nagrania na odpowiednie odcinki (nie w każdej wersji jest dostępne cięcie plików)

2.     Rozpoznawane pliki muszą być w formacie .wav (riff pcm) z częstotliwością próbkowania 16 kHz / 16 bit mono. Jeżeli nie zostały one nagrane SkryBotem (Nagrywaj / Nie rozpoznawaj), przed przystąpieniem do Rozpoznawania plików użytkownik powinien przeprowadzić konwersję plików konwerterem wbudowanym do SkryBota lub zewnętrznym (najlepiej bezpłatnym) np: www.dbpoweramp.com.

3.     Jeśli w zdekodowanym tekście pojawi się informacja o odrzuceniu zdania, oznacza to, że fraza nie przekroczyła zdefiniowanego progu prawdopodobieństwa. Ten próg można zmienić na niższy w Konfiguracja/ Konfiguracja główna, wpisując odpowiednią liczbę w polu min. pewn. zdania. Wybór liczby 100 oznacza, że Skrybot zdekoduje mowę jedynie w sytuacji, gdy będzie 100% zgodność słowa mówionego z jego modelem zdefiniowanym w programie.

4.     W trakcie rozpoznawania plików nie działa rozpoznawanie z mikrofonu.

11      Jak osiągnąć najlepsze rezultaty rozpoznawania

1. Należy nabyć mikrofon, który umożliwi nagrywanie mowy bez zakłóceń – rodzaje dopuszczalnych mikrofonów opisano w rozdziale 4 Przed uruchomieniem SkryBota, natomiast w rozdziale 7 Konfiguracja mikrofonu i kalibracja mowy znajdują się informacje o tym, jak uzyskać nagrania jak najlepszej jakości.

2. Należy:

a. zadbać o właściwą jakość nagrywania czyli prawidłowo ustawić mikrofon i czułość nagrywania (użyć mikrofonu z wtyczką USB lub karty dźwiękowej USB)

b. wykonać kalibrację – rozdział 8 Konfiguracja SkryBota,

3. Dobre rozpoznawanie mowy w rozmowach wielu osób (wywiady, konferencje, spotkania, narady, sesje rad gmin, miast) nagranej w plikach jest możliwe przy zastosowaniu jednego z poniższych sposobów:

a.       Należy tę mowę przedyktować swoim głosem odsłuchując plik i nagrać korzystając dyktafonu SkryBota – czerwony mikrofon Nagrywaj/Nie rozpoznawaj. Proces nagrywania można pauzować, np. zadanie po zdaniu, aby powstał pojedynczy plik dźwiękowy jak najlepszej jakości.

b.       Można użyć funkcji dodatkowej – wielokanałowego nagrywania – gdzie każdy z mówców musi mieć swój mikrofon USB.  Do tego celu nalepiej użyć programu instalowanego ze SkryBotem – Multitrack Microphone USB Recorder.

Uwaga: zalecamy mikrofony gardłowe dla pełnej separacji  sygnału mowy, aby na każdym kanale nagrywał się głos wyłącznie jednego mówcy. Więcej informacji na ten temat znajduje się w rozdziale 17 Wielokanałowe nagrywanie i rozpoznawanie SkryBotem.

12 Tryb komend

Podczas rozpoznawania mowy, użytkownik może korzystać z komend głosowych, sterując w ten sposób pracą SkryBota, np.: gdy powiesz „skrybot wstaw kropkę” zostanie wpisana kropka w tekście.

Po naciśnięciu przycisku Komendy głosowe w zakładce  Konfiguracja, użytkownik może zapoznać się z dostępnymi komendami głosowymi (Rys.22).

 

Rys. 22  Dostęp do
zaprogramowanych w SkryBocie komend głosowych

13 Tryb wyszukiwania słów/fraz

SkryBot posiada wbudowaną opcję wyszukiwania słów oraz całych fraz w rozpoznanych przez siebie plikach. Do uruchomienia tej funkcjonalności służy przycisk Szukaj w menu Narzędzia.

Rys. 23 Tryb
wyszukiwania fraz

Frazę lub słowo, które SkryBot ma wyszukać, należy wpisać w polu tekstowym w górnej części okna. Jako folder do wyszukiwania domyślnie został zadeklarowany C:\Skrybot\results. Użytkownik może jednak samodzielnie wybrać folder, klikając przycisk z lewej strony okna tekstowego Folderu wyszukiwania lub wpisać ścieżkę dostępu.

W celu dostosowania działania wyszukiwarki do swoich potrzeb użytkownik może określić, czy wyszukiwanie ma być przeprowadzone ze 100% dokładnością (zaznaczone pole wyboru Dokładny), czy w sposób przybliżony. W przypadku wyboru wyszukiwania w trybie przybliżonym, SkryBot pozwala na zdefiniowanie ilości dopuszczalnych różnic w wyszukiwanej frazie (zaznaczone pole wyboru Przybliżony)
lub określenia procentowego różnic ,pomiędzy zdefiniowaną i znalezioną frazą (zaznaczone pole wyboru Przybliżony znormalizowany). Do tego celu służy okno Maksymalna ilość różnic. Klikając na znak „-” lub „+” można zmieniać ich dopuszczalną ilość. Użytkownik może również wpisać żądaną przez siebie liczbę.

Oprócz zdefiniowania dokładności wyszukiwania fraz, SkryBot umożliwia również zadeklarowanie, czy w przypadku frazy złożonej z kilku słów, muszą one znaleźć się obok siebie w podanej przez niego kolejności, czy kolejność ich jest dowolna, oraz czy słowa mogą znajdować się w pewnej (zadeklarowanej) odległości. Funkcjonalność ta jest dostępna dla użytkownika w obszarze DOPASUJ ODLEGŁOŚĆ. Tryb dokładny to tryb, w którym SkryBot wyszukuje słowa podane we frazie dokładnie w takiej kolejności w jakiej zostały zadeklarowane przez użytkownika.

 

Rys. 24 Praca w
trybie wyszukiwania fraz

Jeśli użytkownik dopuszcza możliwość, że słowa w zadanej przez niego frazie rozdzielone są przez inne słowa, powinien zaznaczyć opcję Wyszukiwanie w oknie oraz określić wielkość okna. Przez okno rozumiemy długość frazy liczoną w słowach. Dla wyjaśnienia zasady działania tej opcji załóżmy, że użytkownik w oknie Wyszukaj wpisał „będzie prawa”. W zdaniu: „Starosta będzie mógł podjąć postępowanie o zatrzymaniu prawa jazdy.” Słowa „będzie” oraz „prawa” znajdują się w oknie o wielkości 7(słów). Jeśli Skrybot będzie miał zadane wyszukiwanie w/w słów w oknie mniejszym niż 7, przytoczone zdanie nie znajdzie się w wynikach wyszukiwania dla zadeklarowanego wyrażenia, ponieważ okno nie obejmie jednocześnie w/w słów.

Z chwilą, gdy wybrany został folder przeznaczony do przeszukania i tryb wyszukiwania (dokładny lub przybliżony), a w oknie Wyszukaj wpisano jakie słowo/fraza ma być znalezione przez SkryBota, należy kliknąć na przycisk Rozpocznij wyszukiwanie. Wyszukiwanie może być w każdej chwili zatrzymane (przycisk Zatrzymaj wyszukiwanie). Wyniki wyszukiwania pojawią się w postaci nazwy pliku, w którym SkryBot znalazł zadane (lub podobne) słowa, czasu wystąpienia tego słowa w nagraniu oraz określenia znalezionego słowa. W oknie tekstowym z prawej strony wyników wyszukiwania, po dwukrotnym kliknięciu na jeden z wyników pojawi się tekst, w którym znalezione zostało zadane słowo/fraza wraz z czasem jego wystąpienia w nagraniu. Jednocześnie SkryBot rozpocznie odtwarzanie wybranego pliku od miejsca, w którym znalezione zostało słowo/fraza. Użytkownik może dostosować ilość słów w oknie tekstowym poprzez regulację wielkości okna
liczoną (w tym przypadku) w sekundach. Wybór liczby 1 oznacza, że na ekranie wypisany zostanie tekst odpowiadający jednej sekundzie nagrania, wybór liczby 10 oznacza, że ilość wypisanych słów będzie odpowiadała dziesięciu sekundom nagrania.

Rys. 25 Wyszukiwanie
fraz złożonych w wielu słów – wyszukiwanie w oknie

Wybór opcji Scal rezultaty spowoduje wyświetlenie wyników wyszukiwania z podziałem na pliki, w których zostały znalezione zadane słowa, w sposób pokazany na rys. 26.

Rys. 26 Scalone
rezultaty wyszukiwania

14 Tyb prezentacji

Pracując ze SkryBotem użytkownik może edytować nagrania korzystając z trybu prezentacji. Opcja ta dostępna jest w zakładce Narzędzia po naciśnięciu przycisku Prezentacja.

Rys. 27 Tryb
Prezentacji

W trybie prezentacji możliwa jest praca zarówno z plikami, które SkryBot wcześniej już rozpoznał, jak i z plikami nie poddanymi obróbce w SkryBocie.  W tym trybie można śledzić oscylogram pliku dźwiękowego oraz dokonać edycji pliku poprzez wycięcie zaznaczonego fragmentu klikając na przycisk wytnij. Zmiany można cofnąć za pomocą przycisku cofnij.

Aby umożliwić dostosowanie trybu Prezentacji do wymagań użytkownika, SkryBot udostępnia szereg opcji.


I. 
Obszar powiększenie:

1. Pow. Poziome – po kliknięciu na „+” powiększany jest widok oscylogramu w zakresie amplitudy dźwięku. Wartość można zmniejszyć klikając „-”.

2. Wartość ze znakiem – następujące po sobie próbki dźwięku zobrazowane są na oscylogramie naprzemiennie, raz z dodatnią raz z ujemną amplitudą.

 

Rys. 28 Wartości ze
znakiem

3. Wartości absolutne – oscylogram przedstawia wartości dodatnie amplitudy dźwięku wraz z ich lustrzanym odbiciem w miejscu amplitudy o wartości ujemnej

 

Rys. 29 Wartości
absolutne

4. Ze znacznikami słów – na ekranie pojawiają się znaczniki obrazujące początek i koniec każdego ze słów oraz obszarów ciszy.

5. Z napisami – pomiędzy znacznikami słów widoczne są słowa jakie wystąpiły w danym czasie nagrania. Opcja ta jest dostępna jedynie razem z włączoną opcją Ze znacznikami słów. Pojawienie się danego słowa pod oscylogramem jest uzależnione od tego, jakie powiększenie poziome zostało wybrane przez użytkownika. Przy małych powiększeniach, pomiędzy znacznikami danego słowa odległość może być zbyt mała, by w tym miejscu na ekranie monitora mogło się pojawić słowo. Zalecamy korzystanie z tej opcji po odpowiednim dostosowaniu powiększenia poziomego.

     II.
Obszar szczegóły w tym miejscu dostępne są dane dla wybranego przez użytkownika czasu nagrania. Przesuwając kursorem myszki po
oscylogramie, uruchamiamy znacznik w postaci pionowej, białej linii. Zmiana pozycji znacznika, powoduje wyświetlenie w oknach dialogowych tego obszaru danych dotyczących danego elementu nagrania. Wymienione powyżej informacje pojawiają się również w trakcie odtwarzania, pozwalając na śledzenie szczegółów nagrania na bieżąco.

1.     Próbka – informuje o tym która z kolei próbka nagrania została zaznaczona

2.     Czas – wyświetla dokładny czas wystąpienia danej próbki w nagraniu w formacie hh:mm:ss.ms

3.     Milisekundy – wyświetla czas wystąpienia próbki w nagraniu liczony w milisekundach.

4.     Słowo  – dostarcza informacji, o tym jakie słowo występuje w danym miejscu nagrania. Pozwala to na śledzenie wystąpienia poszczególnych słów w nagranym pliku bez konieczności powiększania oscylogramu, do rozmiarów umożliwiających wyświetlenie danego słowa pomiędzy znacznikami słów.

    III.
Przyciski (w prawym górnym roku okna)

1.     otwórz audio ­– wybór pliku dźwiękowego z katalogu wskazanego przez użytkownika

2.     odtwórzodtwarza plik od początku do końca zaznaczonego obszaru nagrania – można również użyć do tego celu klawisza spacji.

3.     wytnij – usuwa zaznaczony fragment nagrania.

4.     auto – automatycznie wykrywa długie obszary ciszy w nagraniu i usuwa je. Wybór tej opcji wiąże się z koniecznością poddania nagrania ponownemu procesowi rozpoznawania, w związku z tym, że czasy wystąpienia poszczególnych słów po usunięciu ciszy ulegną zmianie. O tym fakcie użytkownik będzie informowany każdorazowo po wykonaniu automatycznego usuwania obszarów ciszy.

5.     odt. całość – odtwarza plik od początku, bez względu na to czy i gdzie ustawione było zaznaczenie części nagrania.

6.     cofnij przywraca stan pliku sprzed dokonania w nim ostatniej zmiany.

7.     zapisz  – zapisuje plik na dysku, w wybranym przez użytkownika katalogu.

Poniżej oscylogramu znajdują się przyciski odtwarzacza oraz suwak umożliwiający śledzenie postępu odtwarzania, jak również zdecydowanie od którego momentu nagrania plik ma zostać odtworzony. Nagranie można zatrzymać w dowolnej chwili. Przewijanie w przód i wstecz może być dokonywane skokowo o określoną przez użytkownika ilość sekund. Służą do tego przyciski „+”  i  „-”  rys. 30.

Rys. 30 Przyciski
odtwarzacza – określenie szybkości przewijania nagrania

Rys. 31 Tryb
prezentacji – ustawienia

W dolnej części okna SkryBota widoczny jest tekst – Rys. 31. Pojawia się on tylko dla plików dźwiękowych rozpoznanych wcześniej przez SkryBota. Ilość wyświetlonych słów zależy od ustawienia wartości z prawej strony okna tekstowego. Determinuje ona wielkość przedziału czasu z jakiego wyświetlone zostaną słowa. Na przykład wybór wartości 10, oznacza, że SkryBot będzie w trakcie odtwarzania pliku wyświetlać tekst odpowiadający 10 sekundom nagrania.

W celu zapobiegania sytuacji, gdy użytkownik przez pomyłkę edytuje nieodpowiedni plik, istnieje możliwość sprawdzenia tego z jakim plikiem aktualnie pracuje użytkownik. Ścieżka dostępu do otworzonego pliku jest widoczna poniżej odtwarzacza.

15     Aktualizacja SkryBota

Gdy komputer jest podłączony do Internetu, SkryBot co jakiś czas sprawdza czy jest dostępna aktualizacja i o tym informuje.

Użytkownik może również samodzielnie sprawdzić czy jest dostępna aktualizacja i uruchomić ją klikając w zakładce Narzędzia przycisk Aktualizacje.

Instalacja aktualizacji polega na całkowitym usunięciu oprogramowania SkryBot przez Panel sterowania / Odinstaluj program i ściągnięciu nowej wersji z linku, który podał SkryBot po poinformowaniu o istniejącej aktualizacji. 

16    Wielokanałowe nagrywanie i rozpoznawanie SkryBotem

Do wielokanałowego nagrywania służy program Multitrack Microphone USB Recorder, który w trakcie uruchamiania wykryje podłączone mikrofony. Program działa w systemach Windows Vista, Windows 7, Windows 8, 8.1, Windows 10 i nagrywa dźwięk z każdego mikrofonu USB w osobnej ścieżce audio Wave.

Przed przystąpieniem do nagrywania należy upewnić się, że mikrofony są podłączone w systemie. Należy to zrobić przez zasobnik systemowy Ustawienia Nagrywania / Pokaż urządzenia wyłączone /  Włącz wszystkie mikrofony USB.

Dzięki separacji sygnału z mikrofonów USB, zapisany dźwięk zostanie w całości poddany dekodowaniu bez ryzyka utraty danych, nawet jeśli osoby będą sobie wchodzić w słowo w czasie rozmowy. SkryBot automatycznie oznaczy osobne ścieżki audio wave jako osobnych mówców, a dzięki funkcji Wykrywanie mówców zsynchronizuje rozpoznany tekst do jednego pliku z oznaczeniem mówców/mikrofonów.

Dla pełnej separacji sygnału zaleca się użycie tzw. mikrofonów gardłowych.

17     Wyłączenie SkryBota

SkryBota można wyłączyć na trzy sposoby:

1. Klikając na X w prawym górnym rogu – opcja dostępna po modyfikacji ustawień ogólnych SkryBota (Rozdział 8.1 Konfiguracja główna)

2. W zasobniku systemowym kliknij prawym przyciskiem myszy na oczko SkryBota potem wybierz Wyjdź.

3. Można też wyłączyć przez Menadżera Zadań Windows (Ctrl+Alt+Del) wyłącz proces: Skrybot.app.exe.

18 Informacje dodatkowe

Bezpłatne,
demonstracyjne wersje testowe

https://sf.net/p/skrybotdomowy/files/Releases/

Informacja
o innych wersjach SkryBota

https://skrybot.pl/produkty/

Jak używać
SkryBota

https://youtu.be/kZGIVLDZTsU

Jak
poprawiać rozpoznawanie

https://youtu.be/zwm2TyMDs_c

Informacja
o nagrywaniu wielokanałowym z użyciem SkryBota

https://skrybot.pl/wiadomosci/wielokanalowe-nagrywanie-i-rozpoznawanie-mowy-skrybot/

Filmy instruktażowe

Kanał YouTube poświęcony SkryBotowi

Zgłaszanie
błędów programu

https://sourceforge.net/p/skrybotdomowy/bugs/
lub e-mailem

19     Wiadomości RSS

Dostęp do wiadomości RSS zapewnia przycisk RSS w zakładce Narzędzia. Ponadto program wyświetla w trakcie działania informacje na temat aktualizacji oprogramowania SkryBot w postaci dymków, z przerwą 30 sekund pomiędzy nimi. Wyświetlanie dymków można zablokować w Konfiguracji programu.

20     Wysyłanie plików do Przepisywanie.pl

Aby otrzymywać 100% dokładne przepisane nagrania, wybierz www.Przepisywanie.pl

Po kliknięciu w link http://Przepisywanie.pl na oknie głównym SkryBota połączysz się ze stroną przeznaczoną do wysyłania plików do serwisu przepisywanie.pl – najdokładniejszego przepisywania nagrań do plików tekstowych (Rys.31).

Po wpisaniu swoich podstawowych danych na stronie i kliknięciu przycisku Zapisz, otrzymasz mailem dostęp do panelu klienta, przez który można wysyłać pliki z nagraniami i otrzymywać teksty.

Rys. 32   Strona
internetowa przepisywanie.pl

21     Własność oprogramowania

Producentem oprogramowania SkryBot DoMowy jest Przepisywanie.pl sp. z o.o.

Adres korespondencyjny:

Przepisywanie.pl sp. z o.o.

ul. Czerniakowska 159

00-453 Warszawa

telefon +48 790 013 206

przepisywanie@gmail.com; skrybot@gmail.com; poczta@przepisywanie.pl

http://przepisywanie.pl Przepisywanie nagrań ze słuchu 100% dokładności.

skrybot.pl Centrum technologii rozpoznawania mowy: SkryBot.pl   

www.SkryBot.tv Rozpoznawanie mowy przez Internet: SkryBot.tv

 


[1] Zależnie od wersji SkryBota i umowy. Dla specjalistycznych zastosowań możemy zastosować indywidualne rozwiązania licencjonowania, łącznie z instalacją u klienta serwera licencjonującego.

Interesuje Cię rozpoznawanie mowy? Zaprenumeruj informator SkryBot wpisując swój adres mailowy:
Poufność
Adresy mailowe wpisane z użyciem tego formularza będą wykorzystywane wyłącznie do okresowego udzielania informacji na temat rozwoju oprogramowania skryBot - rozpoznawanie i dekodowanie mowy po polsku.