SkryBot
przewijanie
przewijanie

 

 

 

 

 

skrybot rozpoznawanie mowy logo

 

Instrukcja
obsługi

SkryBot Do Mowy od 2.4.8.17045

Spis treści

1          Przeznaczenie programu SkryBot 3

2          Wymagania systemowe. 5

3          Instalacja SkryBota. 6

4          Przed uruchomieniem SkryBota. 7

5          Pierwsze uruchomienie SkryBota. 8

6          Okno główne SkryBota. 12

7          Konfiguracja mikrofonu i kalibracja mowy. 14

7.1        Ustawienie dźwięku. 14

7.2        Ustawienia dźwięku w systemie Windows. 17

7.3        Regulacja dźwięku w głównym oknie SkryBota. 18

8          Konfiguracja SkryBota. 19

8.1        Konfiguracja główna. 19

8.2        Instrukcja. 21

8.3        Skróty klawiszowe. 21

8.4        Denormalizacja. 22

9          Rozpoznawanie mowy SkryBotem.. 23

9.1        Rozpoznawanie stałe. 23

9.2        Rozpoznawanie przerywane (najpierw nagranie, potem rozpoznawanie – na przemian) 23

9.3        Rozpoznawanie z plików nagranych SkryBotem (dyktafon SkryBota) 23

10       Rozpoznawanie z plików.. 24

11       Jak osiągnąć najlepsze rezultaty rozpoznawania. 28

12       Tryb komend. 29

13       Tryb wyszukiwania słów/fraz. 30

14       Tyb prezentacji 33

15       Aktualizacja SkryBota. 37

16       Wielokanałowe nagrywanie i rozpoznawanie SkryBotem.. 38

17       Wyłączenie SkryBota. 39

18       Informacje dodatkowe. 40

19       Wiadomości RSS. 41

20       Wysyłanie plików do Przepisywanie.pl 42

21       Własność oprogramowania. 43

 

Zastrzeżenie:

Funkcjonalności oprogramowania SkryBot mogą się zmienić
bez uprzedzenia o tym aktualnych użytkowników, dlatego nie gwarantujemy, że w
każdej chwili instrukcja będzie w 100% zgodna z opcjami dostępnymi w
oprogramowaniu.

1          Przeznaczenie programu SkryBot

Podstawowym przeznaczeniem SkryBota jest zamiana mowy na tekst:

·      z mikrofonu,

·      z plików (wyłączone w wersji bezpłatnej).

SkryBot rozpoznaje mowę dyktowaną w obszarze słownictwa zgodnego ze słownikiem zakupionej wersji i zamienia ją na tekst. Oznacza to, że gdy użytkownik mówi do mikrofonu lub wskazuje plik z gotowym nagraniem, jego mowa jest zamieniana na tekst. Podstawowym narzędziem służącym do zamiany mowy na tekst jest słownik SkryBota. Jeśli wypowiedziane słowa nie są zawarte w słowniku
lub tor nagrywania mowy został zakłócony, SkryBot wstawi inne podobnie brzmiące wyrazy.

W przypadku wyższych wymagań odnośnie dokładności rozpoznawania mowy w bardziej wymagającym środowisku jak rozmowy telefoniczne, wymagane jest wykonanie indywidualnej kalibracji programu SkryBot i korzystanie z wersji serwerowej,
jednak może się to wiązać z wyższymi kosztami wstępnymi przygotowania systemu rozpoznawania.

Dokładność rozpoznawania mowy SkryBot podczas zamiany mowy na tekst z nagrań rozmów przeprowadzanych z ukrycia, konferencji, wywiadów będzie zmniejszona jeśli:

·       mowa jest nagrania zbyt cicho lub za głośno,

·       w trakcie rozmów osoby wchodzą sobie w słowo, co uniemożliwia wyizolowanie próbki dźwięku nadającej się do identyfikacji
przez SkryBota;

·       często pojawiają się wtręty typu eee yyy, co utrudnia rozpoznanie mowy, a czasem wręcz uniemożliwia;

·       Należy zwrócić uwagę na jakość nagrania. Aby nagrywać prawidłowo należy zaopatrzyć uczestników w mikrofony umożliwiające uzyskanie indywidualnego nagrania głosu pojedynczej osoby, zapewnić właściwą akustykę pomieszczenia oraz zminimalizować szumy zakłócające nagranie;

·       ogólnodostępne oprogramowanie SkryBot nie zawiera wersji kalibrowanej tematycznie i akustycznie do tego rodzaju nagrań. Kalibracja SkryBota dla zwiększenia dokładności rozpoznawania w takich przypadkach jest wykonywana indywidualnie na zamówienie.

Zalecany sposoby korzystania ze SkryBota podczas zamiany mowy na tekst rozmów wielu osób lub dla nagrań gorszej jakości:
1. odsłuchiwanie i dyktowanie-powtarzanie, tego co się słyszy w słuchawkach własną mową do dyktafonu SkryBota (przycisk Nagrywaj / Nie rozpoznawajczyli „przepisywania nagrań mową”. Dyktafon SkryBota ma możliwość pauzowania nagrywania dlatego można utworzyć w ten sposób plik, który potem zostanie przepisany automatycznie, lub korzystamy z funkcji rozpoznawania na bieżąco
(przycisk Nagrywaj / Rozpoznawaj lub przycisk Rozpoznawaj stale). Czyli odsłuchujemy fragmentami nagranie i dyktujemy
usłyszaną treść.
2. można zastosować wielokanałowe nagrywanie z pełną separacją sygnału (
rozdział 17 Wielokanałowe nagrywanie i rozpoznawanie SkryBotem).

Uwaga: Jeśli dyktowane słownictwo będzie wykraczało poza zasoby licencjonowanego słownika SkryBota, to nagrane wyrazy zostaną zamienione na słowa brzmiące podobnie fonetycznie.

Dostępne są wersje SkryBota z wbudowanym słownikiem dostosowanym do pracy z tekstami prawniczymi, administracyjnymi oraz medycznymi. Więcej informacji na ten temat można znaleźć na stronie www.SkryBot.pl.

 

2
Wymagania systemowe

Aby program SkryBot mógł działać poprawnie, komputer, na którym użytkownik planuje go zainstalować,
powinien spełniać poniższe wymagania:

1.
System operacyjny Windows 10; 8.1; 8; 7; Vista; (32 i 64 bit),

2.     Procesor mininalnie 2 GHz,

3.     Minimum 3 GB RAM,

4.     Połączenie internetowe,

5.     Karta dźwiękowa oraz zewnętrzny mikrofon,

6.     Odpowiednia ilość wolnej
przestrzeni dyskowej HDD
,

7.
Zainstalowane
najnowsze poprawki Microsoft z aplikacji Windows Update. Niektóre stare wersje
systemów operacyjnych Windows 7 bez tych poprawek nie uruchomią SkryBota.

 

Zalecana
konfiguracja: procesor i7 z taktowaniem powyżej 3 GHz, od generacji 7mej; 4GB
RAM oraz instalacja wszelkich niezbędnych aktualizacji systemu.

3
Instalacja
SkryBota

Oprogramowanie jest przeznaczone dla
systemów Windows Vista;7; 8; 8.1; 10 itd. oraz wersji serwerowych Windows
2008-2012.
System,
na

1.
Ściągnij
oprogramowanie w dowolne wybrane miejsce na dysku lokalnym.
Pamiętaj, że w zależności
od rodzaju wersji SkryBota, musisz mieć odpowiednią ilość wolnego miejsca na
dysku i wolnej pamięci RAM. Program systematycznie zajmuje coraz więcej miejsca
na dysku, zapisując nowe nagrania i teksty.
Domyślna lokacja plików tworzonych w trakcie
uruchomienia SkryBota to C:\Skrybot\Results, którą można zmienić w
ustawieniach.

2.    Uruchom plik instalatora: InstalatorSkrybotDoMowy<numerWersji>.exe

3.    Przeczytaj i jeżeli chcesz kontynuować, to zaakceptuj licencję. Przejdź przez wszystkie kroki instalacji klikając Dalej. W trakcie instalacji mogą zostać zainstalowane niezbędne dodatkowe składniki oprogramowania (np. .Net Framework 4.6 oraz C/C++ Runtime environment)

4.     Niektóre programy antywirusowe zgłaszają rzekome problemy. Wynika to ze sposobu komunikacji pomiędzy dekoderem mowy, a głównym interfejsem użytkownika. Komunikacja ta odbywa się przez tzw. gniazdka TCP/IP. Do tego dochodzi również ‘wstrzykiwanie’ tekstu do innych
programów. Ostrzeżenia antywirusa należy zignorować i upewnić się, że zapora ogniowa ‘firewall’ nie blokuje dostępu programom Skrybot.App.exe oraz Skrybot.Decoder.Server.exe.

5.    Po instalacji, dla oszczędności miejsca na dysku, możesz usunąć ściągnięte archiwum SkryBota oraz rozpakowany folder.

6.    SkryBot zainstaluje się w C:\Program Files\Skrysoft\Skrybot *\ (systemy 32bit) lub C:\Program Files (x86)\ Skrysoft\Skrybot *\ (systemy 64bit). Pliki z nagrywaną mową i tekstem będą się zapisywać w katalogu: C:\Skrybot\Results.

 

Wskazówka:

Poprzednią wersję SkryBota z takim samym słownikiem, przed instalacją nowszej wersji, zalecamy  ODINSTALOWAĆ / USUNĄĆ . W
przeciwnym przypadku może nastąpić konflikt
uniemożliwiający poprawne działanie programu. Aktualizacja sama przeprowadzi odpowiednie procesy lub poinformuje co zrobić.

4          Przed uruchomieniem SkryBota

Aby używać oprogramowania do zamiany mowy na tekst SkryBot, należy posiadać:

1.    komputer z zainstalowanym systemem z rodziny Windows: Vista, 7; 8; 8,1; 10; Windows Server
2008, Windows Server 2012,

2.    zainstalowaną prawidłowo kartę dźwiękową, lub płytę główną z wejściem mikrofonu jack 3.5mm lub

3.    podłączony mikrofon (najlepiej nagłowny) – nie jest potrzebny, jeśli dekodujesz z plików.

W pracy ze SkryBotem bardzo dobrze sprawdzają się są różnego rodzaju mikrofony ze słuchawkami do telefonów, ale jeśli mają wyjście jack 3,5 mm (Rys.1), powinny być podłączone za pomocą karty dźwiękowej USB.

Rys. 1   Mikrofony ze
słuchawkami do telefonów z wyjściem jack 3,5 mm

Lepsze efekty można uzyskać, używając mikrofonów ze słuchawkami  na złączu USB (Rys.2):
Sennheiser pc 7, Sennheiser pc 8; Logitech H390, 960; Plantronics Audio 345, Creative HS720, Plantronics 628 USB DSP i wiele innych.

 

Rys. 2   Mikrofony ze
słuchawkami na złączu USB

Jeśli masz „zwykły” mikrofon z wyjściem jack 3,5 mm, to jakość nagrywania można znacznie poprawić używając karty dźwiękowej na złączu USB (Rys.3).

 

Rys. 3   Karty
dźwiękowe na złączu USB

Jeśli nie masz uruchomionej karty dźwiękowej i mikrofonu, SkryBot wyświetli informację o tym lub przyciski nagrywania nie będą aktywne. Będzie działać tylko rozpoznawanie plików.

Kolejnym krokiem jest sprawdzenie czy mikrofon zainstalowany w systemie nagrywa dźwięk i czy poziom dźwięku jest właściwy. Podstawowym narzędziem do sprawdzenia jakości nagrywania może być SkryBot i jego opcja Konfiguracja / Ustawienia nagrywania / Nagrywanie i odtwarzanie. Dźwięk rejestrowany przez mikrofon wizualizowany jest w postaci oscylogramu. Prawidłowo skonfigurowany mikrofon rejestruje dźwięk oznaczony barwą zieloną. Wszelkie dźwięki o barwie czerwonej lub niebieskiej pogarszają jakość dekodowania mowy do tekstu. Czerwony kolor oznacza dźwięk zbyt głośny, a niebieski za cichy. Poziom czułości mikrofonu można dostosować za pomocą suwaka znajdującego się z lewej strony oscylogramu. Im niżej ustawiony zostanie suwak, tym mniejsza będzie czułość mikrofonu na docierające do niego dźwięki.

Zaleca się każdorazowe odsłuchanie nagrania dla sprawdzenia jego poprawności. Pliki z nagraniem zapisywane są w folderze C:\SkryBot\results.

 

5          Pierwsze uruchomienie SkryBota

Kliknij dwukrotnie ikonę SkryBota na pulpicie lub w folderze instalacyjnym.

SkryBota można również uruchomić z katalogu C:\Program Files(86)\Skrysoft\Skrybot *
poprzez plik Skrybot.App.exe.

Przy pierwszym uruchomieniu po instalacji, pojawi okno do wpisania numeru licencji.

W oknie tym należy wkleić lub wpisać numer licencji otrzymanej w e-mailu. Po kliknięciu przycisku Zastosuj, SkryBot sprawdzi czy podany numer licencji jest prawidłowy. Postęp i czas trwania tego procesu można obserwować na ekranie.

 

Rys. 4   Okno
weryfikacji licencji

Zakup pojedynczej licencji SkryBota uprawnia do uruchomienia go na maksymalnie trzech[1] komputerach.

Licencja pozwala na korzystanie z aktualizacji i poprawiania jakości rozpoznawania
przez rok od momentu zakupu.

Przedłużanie aktualizacji jest dostępne w promocyjnych cenach, gdy abonament na aktualizację jest kontynuowany przed wygaśnięciem rocznej licencji. Aktualizacje można przedłużyć na kilka lat w promocyjnej cenie za niewielki procent wartości podstawowej wersji programu.

SkryBot przy pierwszym uruchomieniu połączy się z serwerem licencji i sprawdzi ważność licencji. Ważność licencji można przedłużyć. Należy pamiętać, że jest to niezbędne dla dostępu do aktualizacji, poprawiania rozpoznawania i rozbudowy słownika. SkryBot uruchamia się, jeżeli wpisana licencja jest aktualna lub nie została zablokowana ze względu na upływ terminu ważności. Dlatego aby uruchomić SkryBota po raz pierwszy, należy mieć działające połączenie z internetem. Takie same są wymagania podczas uruchamiania aktualizacji, poprawiania rozpoznawania i zmiany słownika.

Uwaga: W niektórych przypadkach, przy pierwszym uruchomieniu SkryBota, należy wyłączyć Ochronę Windows, inny Firewall
lub dodać SkryBota do wyjątków Ochrony Windows.

Uwaga: Zdarza się, że bezpłatne programy antywirusowe (dotyczy to niektórych programów budowanych przez społeczność Open Source) dają fałszywe wyniki testu antywirusowego w odniesieniu do SkryBota. SkryBot ściągany ze http://SkryBot.pl  i http:// sf.net/p/ skrybotdomowy oraz stron współpracujących: komputer świat, programosy, instalki, dobre programy – na pewno nie zawiera wirusów.

Należy pamiętać, aby nie udostępniać własnego klucza osobom trzecim, gdyż użycie go przez inną osobę zmniejszy maksymalny limit komputerów (trzy), na których można uruchomić własnego SkryBota.

Po zaakceptowaniu numeru licencji, otworzy się okno informacyjne SkryBota – tzw. ekran powitalny (Rys.5).

 

Rys. 5   Okno
informacyjne SkryBota

W oknie informacyjnym SkryBota można wykonać następujące działania:

1.     Kliknąć Mikrofon, aby przejść do ustawienia poziomu nagrywania mikrofonu i wybrać właściwy mikrofon, jeśli w systemie jest więcej niż jedno urządzenie. Zwiększanie wydajności nie jest obecnie wspierane. Jeśli karta dźwiękowa ma tę opcję ustaw zwiększenie wydajności w systemie).

2.     Kliknąć Kalibracja Mowy – aby zoptymalizować ustawienia dźwięku.

3.    Opcjonalnie kliknąć pole wyboru, aby to okno nie pojawiało się w przyszłości.

4.    Kliknąć English –  aby zmienić język interfejsu z polskiego na angielski.

5.    Zamknąć – po kliknięciu na Zamknij przejdziesz do okna głównego.

 

Jeśli mikrofon jest prawidłowo podłączony wyświetli się w oknie: Mikrofon/ Ustawienia Nagrywania / Urządzenia lub Konfiguracja/ Ustawienia Nagrywania / Urządzenia.  Aby wybrać mikrofon wystarczy raz kliknąć w linię z nazwą urządzenia. Analogicznie należy postąpić z urządzeniem odtwarzającym.

 

Rys. 6   Ustawienia
Nagrywania

6          Okno główne SkryBota

 Okno główne (Rys.7) pozwala na dostęp do najważniejszych funkcji programu SkryBot. Przyciski dostępne w tym oknie służą do rozpoznawania mowy w różnych trybach. Zostały one omówione w rozdziale 9 Rozpoznawanie mowy SkryBotem.

W celu jak najlepszej kontroli nad procesem nagrywania i dekodowania mowy na tekst, w oknie głównym SkryBota dostępne są informacje na temat: urządzenia nagrywającego, odtwarzającego, bieżącego statusu dekodera oraz statusu nagrywania i jego postępu.

 

Rys. 7   Okno główne SkryBota

Dla pełnej kontroli długości procesu rozpoznawania, w trakcie dekodowania (w prawym górnym rogu okna) wyświetla się porównanie szybkości dekodowania do realnego czasu (RT). Jeśli wartość jest wyższa od 1, oznacza że czas dekodowania będzie krótszy niż długość pliku, a wydajność komputera jest wysoka.

W lewym dolnym rogu okna, dostępne są informacje o kolejnych krokach wykonanych przez program SkryBot, w celu zdekodowania mowy. Informacje bezpośrednio dotyczące pracy dekodera mowy zostały oddzielone od Informacji Ogólnych, poprzez umieszczenie ich w zakładce Dekoder.

Prawa część okna głównego, to edytor tekstu, do którego można wklejać własny tekst (np. gdy chcemy go przedyktować i wykorzystać do Poprawiania rozpoznawania). Głównym przeznaczeniem tego edytora jest jednak umożliwienie użytkownikowi bieżącej kontroli nad wynikami dekodera. W oknie tym będzie pojawiał się tekst, będący wynikiem procesu dekodowania mowy.
Po zakończeniu dekodowania tekst, który wyświetli się w oknie edytora, można poddać korekcie, a następnie zapisać w formacie .rtf lub .txt

Wybór zakładki Edycja na bieżąco pozwala na wyświetlenie w oknie edytora, tekstu zdekodowanego przy użyciu przycisków Nagrywaj / Rozpoznawaj oraz  Rozpoznawaj Stale. Tekst nie będzie zawierał znaczników czasu wystąpienia poszczególnych próbek nagrania, można jednak dla swojej wygody dostosować opcje dotyczące czcionki (rozmiar, rodzaj, kolor) układu tekstu oraz wkleić tekst
bezpośrednio, wczytując plik tekstowy w formacie .rtf lub .txt.
Test z edytora można również zapisać w obu tych formatach korzystając z przycisku Zapisz.

W zakładce Edycja z nagrania istnieje możliwość wyboru zdekodowanego już pliku nagrania. W tym miejscu zdekodowany plik przedstawiony jest w postaci zdań z określeniem dokładnego czasu ich pojawienia się w nagraniu. Plik można odsłuchać, korzystając z przycisków odtwarzacza, znajdującego się pod edytorem tekstu. Dostępna jest opcja przesłuchania pliku od dowolnie wybranej próbki
mowy, poprzez kliknięcie na nią, a następnie na zielony przycisk Start w odtwarzaczuMożna również wrócić do wybranego zdania w trakcie odsłuchiwania całości nagrania, poprzez kliknięcie na niego podczas odtwarzania pliku.

Dla ułatwienia śledzenia zdekodowanego tekstu w trakcie odtwarzania nagrania, należy wybrać opcję Ustaw poz. transkrypcji na podstawie audio w trakcie odtwarzania. W ten sposób bieżące zdanie z nagrania jest zaznaczane w transkrypcji poprzez podświetlenie go na niebiesko.

7          Konfiguracja mikrofonu i kalibracja mowy

7.1     Ustawienie dźwięku

W sterownikach dźwięku komputera należy wyłączyć nieużywane mikrofony. Klikając prawym przyciskiem na głośnik w zasobniku systemowym/ urządzenia nagrywania, można ustawić urządzenia do nagrywania w systemie, włączając i wyłączając odpowiednie mikrofony i wejścia dźwięku.

Do ustawień nagrywania można przejść na dwa sposoby:

1.   W oknie informacyjnym, pojawiającym się przy uruchomieniu SkryBota, należy kliknąć przycisk Mikrofon / Ustawienia nagrywania / Nagrywanie i odtwarzanie.

2.   W oknie głównym SkryBota należy wybrać Konfiguracja / Ustawienia nagrywania / Nagrywanie i Odtwarzanie  (Rys.8).

 

Następnym krokiem jest nagranie mowy i sprawdzenie czy nagrany dźwięk jest czysty i bez zakłóceń.

 

Rys. 8   Konfiguracja
mikrofonu

Dźwięk rejestrowany przez mikrofon wizualizowany jest w postaci oscylogramu. Prawidłowo skonfigurowany mikrofon rejestruje dźwięk oznaczony barwą zieloną. Wszelkie dźwięki o barwie czerwonej lub niebieskiej pogarszają jakość dekodowania mowy do tekstu. Dźwięk zbyt głośny zaznaczony jest w oscylogramie barwą czerwoną, a za cichy – niebieską. Do regulacji poziomu czułości mikrofonu służy suwak, znajdujący się z lewej strony oscylogramu. Im niżej ustawiony zostanie suwak, tym mniejsza będzie czułość mikrofonu na docierające
do niego dźwięki.

W oknie Kalibracji
Mowy
(Rys.9) należy stosować się do wskazówek wyświetlanych na ekranie.
Rezultat pojawi się w dolnym oknie. Jeśli wynik testu jest prawidłowy kliknij Zastosuj.
Jeśli test ma wynik nieprawidłowy, pozostaw ustawienia domyślne lub
spróbuj ponownie przeprowadzić kalibrację.

 

Rys. 9   Okno automatycznej
Kalibracji Mowy

Dźwięk
nagrany podczas procesu kalibracji można odtworzyć i odsłuchać.

Po
wykonaniu automatycznej kalibracji mowy zalecamy przejście do menu Ustawienia
Ręczne
aby sprawdzić czy próg mowy został ustawiony na prawidłowym
poziomie.

Zbyt nisko
ustawiony próg mowy może powodować, że SkryBot będzie próbował rozpoznawać
zakłócenia (szumy), które nie są mową. Spowolni to proces rozpoznawania i może
doprowadzić do pojawienia się niepożądanych słów w rozpoznawanym tekście. Zbyt
wysoki poziom progu mowy sprawi, że SkryBot zignoruje dźwięki, które będą
istotne i części nagrania nie weźmie pod uwagę w procesie rozpoznawania –
Rys.10a i 10b. Dźwięk, który zostanie poddany
obróbce przez SkryBota jest przedstawiony w oknie po filtracji. Okno  przed
filtracją
 zawiera informacje o dźwięku rejestrowanym przez mikrofon.

Ustawienia
ręczne pozwalają na samodzielne ustalenie progu mowy, czułości mikrofonu oraz
parametrów dodatkowych:

1.
Minimalna długość
ciszy wiodącej,

2.
Minimalna długość
mowy,

3.
Maksymalna
długość mowy,

4.
Minimalna długość
ciszy kończącej.

 

SkryBot
pracuje na zasadzie tworzenia kolekcji próbek dźwięku. Następnie
mierzony jest ich czas trwania.
Po przekroczeniu wskazanej, minimalnej długości mowy, próbka jest
powiększana o ciszę wiodącą (na początku próbki) i ciszę kończącą (na końcu
próbki). 

Rysunek 10a Okno ręcznej
Kalibracji Mowy – prawidłowo ustawiony próg mowy

Rys. 10b  Okno ręcznej
Kalibracji Mowy – nieprawidłowo ustawiony próg mowy

7.2
Ustawienia dźwięku w systemie Windows

Po
kliknięciu na ikonę głośnika w zasobniku systemowym, pojawią się pokazane
poniżej opcje (Rys.11). Wybierz Urządzenia do nagrywania.

 

Rys. 11   Wybór
urządzenia do nagrywania dźwięku w komputerze

W panelu
sterowania wybierz dźwięk (Rys.12 i uruchom jeden właściwy mikrofon (jeśli
jest ich więcej w systemie). Sprawdź czy działa.

 

Rys. 12   Wybór
mikrofonu w panelu sterowania

7.3     Regulacja
dźwięku w głównym oknie SkryBota

Regulacja
czułości mikrofonu odbywa się za pomocą suwaka znajdującego się z lewej strony
obszaru wizualizacji dźwięku(Rys.13).

 

Rys. 13  Ręczna
regulacja czułości mikrofonu

W głównym
oknie programu dostępny jest stały podgląd na wizualizację nagrywanego dźwięku.
Możesz dzięki temu również na bieżąco regulować i dostosowywać dźwięk.

BARDZO
WAŻNE:
Wizualizacja
głośności nagrania z kontrolą czułości mikrofonu służy do ustawienia
prawidłowej głośności nagrywanego dźwięku. Ważne jest, żeby dźwięk nie był zbyt
cichy ani zbyt głośny (Rys.14).

 

Rys. 14   Przykładowe
wizualizacje nagrywanego dźwięku przy różnych ustawieniach czułości mikrofonu

Po
ustawieniu głośności na właściwym poziomie, SkryBot jest gotowy do działania.

8
Konfiguracja
SkryBota

Niektóre
opcje konfiguracji zostały omówione w osobnych rozdziałach:

·
rozdział 7 Konfiguracja
mikrofonu i kalibracja mowy

·
rozdział 13 Tryb komend  

 

Poniżej
opisane zostały pozostałe funkcje dostępne dla użytkownika, w celu dostosowania
SkryBota do swoich wymagań.

 

8.1     Konfiguracja
główna

Możliwa
jest pełniejsza konfiguracja ustawień. Aby jej dokonać należy po wejściu do
okna Konfiguracji kliknąć przycisk Konfiguracja główna (Rys. 15) i
dostosować opcje do swoich potrzeb i wymagań.

Rys. 15   Sposób
przejścia do konfiguracji głównej SkryBota

Okno Konfiguracji
głównej
 podzielone jest na trzy obszary:

1.
Ustawienia
nagrywania

użytkownik może w tej części:

a.     samodzielnie zdefiniować folder
docelowy dla zdekodowanych/nagranych plików oraz dla plików usuniętych,

b.    zmienić początek nazwy nagrywanych plików.

2.     Ustawienia ogólne dotyczą:

a.     wyglądu okna SkryBota

b.    języka interfejsu (zmiana języka
interfejsu nie powoduje zmiany języka, w którym SkryBot rozpoznaje mowę, a
jego zmiana wymaga zamknięcia i ponownego uruchomienia programu)

c.     formatu czcionki używanej w edytorze
tekstu w oknie głównym,

d.    można też za pomocą pól wyboru włączyć
lub wyłączyć opcje:

·      wyświetlania ekranu powitalnego,

·      uruchamiania SkryBota w formie
zminimalizowanej,

·      zapisu danych po zakończeniu pracy z
programem,

·      wiadomości RSS,

·      wyświetlania sugestii w pasku zadań,

·      automatycznego uruchomienia SkryBota
przy starcie komputera,

·      automatycznego pisania z dużej
litery,

·      zamykania SkryBota klasycznym
sposobem, tj. klikając na X w prawym górnym rogu okna.

 

3.     Ustawienia dekodowania – tutaj użytkownik może określić:

a.     lokalizację szybkich i dokładnych
ustawień dekodowania,

b.    mimimalną pewność komendy, czyli
wyrażone w procentach prawdopodobieństwo rozpoznania komendy zgodnie z modelem zaprogramowanym
w słowniku,

c.     minimalną pewność zdania – czyli
wyrażone w procentach prawdopodobieństwo, że wypowiedziana fraza jest zgodna ze
słownikiem SkryBota – dla wartości poniżej tego progu SkryBot wyświetli
informację o odrzuceniu zdania,

d.    można również za pomocą pól wyboru
włączyć lub wyłączyć opcje:

·       wstawiania tekstu do edytora tekstowego,
np.: Word, Dyktak, itp.

·       dodawania daty na początku
dekodowanego tekstu,

·       uruchamiania detekcji mowy
automatycznie przy starcie,

·       usuwania nagrania po detekcji ciszy/mowy,

·       dodawania kropki na końcu frazy
zidentyfikowanej jako koniec zdania,

·       dokładnego dekodowania (nie każdy
tekst tego wymaga, a wyłączenie tej opcji pozwala na znaczne przyspieszenie
procesu dekodowania mowy),

·       usunąć krótkie słowa w sytuacji, gdy
występują pojedynczo lub towarzyszą komendom głosowym.

 

Dla wygody
poruszania się w oknie Konfiguracji głównej, po najechaniu kursorem
myszki na dostępną opcję modyfikacji ustawień, wyświetla się krótka
informacja o tym, jaka funkcja SkryBota zostanie w ten sposób zmieniona.

 

Rys. 16   Okno
konfiguracji głównej SkryBota

8.2     Instrukcja

W
przypadku jakichkolwiek wątpliwości dotyczących funkcjonalności SkryBota
użytkownik ma zapewniony bezpośredni dostęp do Instrukcji. W celu otrworzenia
pliku z jej treścią należy kliknąć przycisk Instrukcja w zakładce Konfiguracja.

Udostępniamy
również
filmy instruktażowe na kanale YouTube poświęconym SkryBotowi.

8.3     Skróty klawiszowe

Podstawowe
funkcje można uruchamiać skrótami klawiszowymi. Zdefiniowane klawisze skrótu
można przeglądać wybierając zakładkę Konfiguracja / Klawisze skrótu (Rys.
17). Oprócz korzystania z klawiszy skrótu już zdefiniowanych,
użytkownik może sam zdefiniować skróty klawiszowe, które usprawnią poruszanie
się w SkryBocie i dostosują go do jego indywidualnych potrzeb.

Istnieje
możliwość definiowania skrótów klawiszowych dla „akcji”, czyli wywołania
konkretnego zachowania się programu, oraz dla wstawiania konkretnych wyrażeń,
które są często stosowane i charakterystyczne dla danego
użytkownika.

 

Rys. 17   Sposób
wyboru opcji Klawisze Skrótu oraz przykłady zdefiniowanych skrótów
klawiszowych

8.4     Denormalizacja

Przycisk Denormalizacja
służy do podglądu dostępnych opcji denormalizacyjnych, czyli możliwości
zamiany wypowiedzianych słów na skróty i symbole, jakie są powszechnie
stosowane w tekście.

 

9
Rozpoznawanie
mowy SkryBotem

9.1     Rozpoznawanie
stałe

Przyciskiem
Win+F9 albo klikając na przycisk Rozpoznawaj Stale uruchomia się
ciągły tryb rozpoznawania. W tym trybie SkryBot stale nasłuchuje i
rozpoznaje wszystkie dźwięki nagrywane mikrofonem, na bieżąco pokazując
zdekodowaną mowę w oknie tekstowym.

9.2     Rozpoznawanie
przerywane (najpierw nagranie, potem rozpoznawanie – na przemian)

Za pomocą
skrótu Win+F4 lub klikając na przycisk Nagrywaj / Rozpoznawaj
uruchamia się nagrywanie. Nagranie zostanie zakończone z chwilą ponownego
kliknięcia przycisku lub skrótu klawiszowego Win+F4.Po zakończeniu
nagrania SkryBot zamieni mowę na tekst. W tym trybie SkryBot nagrywa tylko gdy
przycisk jest wciśnięty.

W wyniku
działania tej funkcji w katalogu C:\Skrybot\results powstają pliki .wav
(dźwięk) oraz .txt (tekst) i .xml (znaczniki czasowe i
poziom ufności) oznaczone (dla ułatwienia identyfikacji) za pomocą daty
oraz godziny nagrania.

Pliki .wav
zawierają nagranie, plik .txt zawiera zdekodowany przez SkryBot tekst,
natomiast w pliku .xml można znaleźć informacje o tym z jakim
prawdopodobieństwem poszczególne słowa zostały rozpoznane przez program.

9.3     Rozpoznawanie
z plików nagranych SkryBotem (dyktafon SkryBota)

Przycisk Nagrywaj
/ Nie rozpoznawaj
oraz skrót Win+F3 pozwalają nagrywać mowę bez rozpoznawania.
Nagranie można potem rozpoznawać używając funkcji Rozpoznawanie plików.
Nagranie podczas odsłuchiwania plików audio np. rozmów i dyktowania, można
pauzować  i wznawiać przyciskiem Pauza/Wznów. Dzięki temu wszystko
zostanie nagrane w jednym pliku.

 

10
Rozpoznawanie
z plików

SkryBot
może rozpoznawać mowę, nawet gdy nie ma podłączonego mikrofonu. Do tego celu
służy opcja rozpoznawania z plików. Pojedynczy plik poddany dekodowaniu nie
może być dłuższy niż 10 minut.

W
trakcie rozpoznawania mowy z plików nie należy korzystać z innych
funkcjonalności SkryBota.

Uwaga: SkryBot rozpoznaje tylko pliki .wav
16 khz/16 bit mono. Aby SkryBot mógł dokonać zamiany pliku z zapisaną mową
na tekst, należy pliki mp3, mp4, wma przekonwertować za pomocą
wbudowanego konwertera. Dotyczy to również plików
o końcówce .wav nienagranych SkryBotem.
Wymienione wyżej pliki należy przekonwertować w zakładce Narzędzia / Rozpoznawanie
Plików / Konwersja audio
(Rys.18). Nowe pliki dostaną na koniec nazwy
dopisek –16kHz.wav.

Jeśli
chcesz rozpoznać odcinek nagrania, możesz nagranie przeciąć używając
konwertera. Należy wybrać kratkę dzielenia pliku w konwerterze SkryBota i
ustalić na jakie odcinki ma zostać podzielony. Dłuższe nagrania mogą
zostać pocięte przez konwerter na ustalone odcinki.

Uwaga: nie każda wersja SkryBota oferuje
cięcie plików.

Aby wybrać
plik przeznaczony do konwersji należy użyć przycisku DODAJ DO LISTY.
Następny krok to zaznaczenie kratki obok wybranego pliku i naciśnięcie
przycisku KONWERTUJ. Pliki dodane omyłkowo można usunąć pojedynczo
zaznaczając sąsiadujące z nim pole wyboru, a następnie klikając przycisk USUŃ
Z LISTY .
Można też usunąć wszystkie pliki znajdujące się w oknie PLIKI
DO KONWERSJI
za pomocą przycisku USUŃ WSZYSTKIE.

 

Rys. 18
Przeprowadzanie konwersji plików do formatu wymaganego przez SkryBota

Pozostałe
nieobsługiwane formaty można konwertować m.in. bezpłatnym konwerterem ze strony
www.dbpoweramp.com

Aby
rozpoznawać pliki należy dodać je do DANYCH WEJŚCIOWYCH poprzez
kliknięcie na przycisk Dodaj pliki do listy (Rys.19). Pliki dodane
omyłkowo można usunąć pojedynczo, klikając przycisk Usuń wybrane lub
zbiorowo za pomocą przycisku Usuń wszystkie. Po podwójnym
kliknięciu na wybrany plik z górnej listy, można przesłuchać go, aby zdecydować,
czy jest to nagranie, które chcemy dekodować. Do tego celu można również użyć ODTWARZACZA
wbudowanego do tego modułu.

 

Rys. 19
Rozpoznawanie mowy z plików

Przetwarzanie
pliku uruchamiane jest przyciskiem Rozpocznij przetwarzanie. Na ekranie
pojawi się pasek postępu procesu przetwarzania oraz informacja o aktualnym
statusie pliku (Rys.20):

·       Zakolejkowano,

·       Rozpoczęto,

·
Zakończono.

Uwaga: Należy pamiętać, że w zależności od
długości pliku, trybu (dokładny / szybki) oraz szybkości komputera
dekodowanie może zająć do paru godzin. Rozpoczęty proces można przerwać
klikając na klawisz Stop.

Po
zdekodowaniu pliku, w katalogu C:\Skrybot\results pojawi się plik z
rozszerzeniem .txt o takiej samej nazwie co plik .wav, który
był dekodowany oraz plik .xml z czasami wstąpienia wyrazów. Jeśli w tekście
pojawi się „odrzucenie zdania” oznacza to, że próg dopuszczalnego
prawdopodobieństwa rozpoznawania fraz, był ustawiony na wyższą wartość
niż uzyskana przez SkryBot w trakcie dekodowania.

 

Rys. 20   Przebieg
procesu dekodowania mowy z plików

Innymi
słowy: rozpoznana fraza została uznana za mało prawdopodobną, a tym samym
niezgodną z oczekiwaniem użytkownika. Powodem zaistnienia takiej sytuacji może
być również brak danego słowa w słowniku SkryBota, niewyraźna mowa lub
zakłócenia zarejestrowane w danej próbce nagrania, uniemożliwiające poprawną
identyfikację dźwięków. W zależności od powodu „odrzucenia zdania” użytkownik
może:

1.
ponownie
nagrać mowę (tym razem bez zakłóceń)

i poddać prawidłowe nagranie procesowi dekodowania
,

2.     zmniejszyć próg
zdefiniowanego prawdopodobieństwa (Konfiguracja Główna) i
 poddać nagranie dekodowaniu raz
jeszcze,

3.
ręcznie
edytować rozpoznany tekst wpisując poprawne słowo (w sytuacji gdy słownik
SkryBota go nie zawiera).

 

Podsumowując:

1.
Pojedynczy
dekodowany plik nie może mieć więcej niż 10 minut.
Dłuższe nagrania należy najpierw
przekonwertować konwerterem, który automatycznie podzieli nagrania na
odpowiednie odcinki (nie w każdej wersji jest dostępne cięcie plików)

2.     Rozpoznawane pliki muszą być w
formacie .wav (riff pcm) z częstotliwością próbkowania 16 kHz /
16 bit mono. Jeżeli nie zostały one nagrane SkryBotem (Nagrywaj
/ Nie rozpoznawaj
), przed przystąpieniem do Rozpoznawania plików
użytkownik powinien przeprowadzić konwersję plików konwerterem wbudowanym do
SkryBota lub zewnętrznym (najlepiej bezpłatnym) np:
www.dbpoweramp.com.

3.     Jeśli w zdekodowanym tekście pojawi
się informacja o odrzuceniu zdania,
oznacza
to, że fraza nie przekroczyła zdefiniowanego progu prawdopodobieństwa. Ten próg
można zmienić na niższy w Konfiguracja/ Konfiguracja główna, wpisując
odpowiednią liczbę w polu min. pewn. zdania. Wybór liczby 100 oznacza,
że Skrybot zdekoduje mowę jedynie w sytuacji, gdy będzie 100% zgodność słowa
mówionego z jego modelem zdefiniowanym w programie.

4.     W trakcie rozpoznawania plików nie
działa rozpoznawanie z mikrofonu.

 

11      Jak
osiągnąć najlepsze rezultaty rozpoznawania

1.
Należy nabyć
mikrofon, który umożliwi nagrywanie mowy bez zakłóceń – rodzaje dopuszczalnych
mikrofonów opisano
w rozdziale 4 Przed uruchomieniem
SkryBota
, natomiast w rozdziale 7 Konfiguracja mikrofonu i
kalibracja mowy

znajdują się informacje o tym, jak uzyskać nagrania jak najlepszej jakości.

2.
Należy:

a.
zadbać o właściwą
jakość nagrywania czyli prawidłowo ustawić mikrofon i czułość nagrywania (użyć
mikrofonu z wtyczką USB lub karty dźwiękowej USB)

b.
wykonać kalibrację
rozdział
8 Konfiguracja SkryBota
,

3.
Dobre
rozpoznawanie mowy w rozmowach wielu osób (wywiady, konferencje, spotkania,
narady, sesje rad gmin, miast) nagranej w plikach jest możliwe przy zastosowaniu
jednego z poniższych sposobów:

a.       Należy tę mowę przedyktować swoim
głosem odsłuchując plik i nagrać korzystając dyktafonu SkryBota – czerwony
mikrofon Nagrywaj/Nie rozpoznawaj. Proces nagrywania można pauzować, np.
zadanie po zdaniu, aby powstał pojedynczy plik dźwiękowy jak najlepszej
jakości.

b.       Można użyć funkcji dodatkowej – wielokanałowego
nagrywania
– gdzie każdy z mówców musi mieć swój mikrofon USB.  Do
tego celu nalepiej użyć programu instalowanego ze SkryBotem –
Multitrack Microphone USB
Recorder
.

Uwaga: zalecamy mikrofony gardłowe dla
pełnej separacji  sygnału mowy, aby na każdym kanale nagrywał się
głos wyłącznie jednego mówcy. Więcej informacji na ten temat znajduje się w
rozdziale
17 Wielokanałowe nagrywanie i rozpoznawanie SkryBotem.

12
Tryb komend

Podczas
rozpoznawania mowy, użytkownik może korzystać z komend głosowych, sterując
w ten sposób pracą SkryBota, np.: gdy powiesz „skrybot wstaw kropkę”
zostanie wpisana kropka w tekście.

Po naciśnięciu
przycisku Komendy głosowe w zakładce  Konfiguracja, użytkownik
może zapoznać się z dostępnymi komendami głosowymi (Rys.22).

 

Rys. 22  Dostęp do
zaprogramowanych w SkryBocie komend głosowych

13
Tryb wyszukiwania słów/fraz

SkryBot
posiada wbudowaną opcję wyszukiwania słów oraz całych fraz w rozpoznanych przez
siebie plikach. Do uruchomienia tej funkcjonalności służy przycisk Szukaj w
menu Narzędzia.

Rys. 23 Tryb
wyszukiwania fraz

Frazę lub
słowo, które SkryBot ma wyszukać, należy wpisać w polu tekstowym w górnej
części okna. Jako folder do wyszukiwania domyślnie został zadeklarowany C:\Skrybot\results.
Użytkownik może jednak samodzielnie wybrać folder, klikając przycisk z lewej
strony okna tekstowego Folderu wyszukiwania lub wpisać ścieżkę dostępu.

W celu
dostosowania działania wyszukiwarki do swoich potrzeb użytkownik może określić,
czy wyszukiwanie ma być przeprowadzone ze 100% dokładnością (zaznaczone pole
wyboru Dokładny), czy w sposób przybliżony. W przypadku wyboru
wyszukiwania w trybie przybliżonym, SkryBot pozwala na zdefiniowanie ilości
dopuszczalnych różnic w wyszukiwanej frazie (zaznaczone pole wyboru Przybliżony)
lub określenia procentowego różnic ,pomiędzy zdefiniowaną i znalezioną frazą
(zaznaczone pole wyboru Przybliżony znormalizowany). Do tego celu służy
okno Maksymalna ilość różnic. Klikając na znak „-” lub „+” można
zmieniać ich dopuszczalną ilość. Użytkownik może również wpisać żądaną przez
siebie liczbę.

Oprócz
zdefiniowania dokładności wyszukiwania fraz, SkryBot umożliwia również
zadeklarowanie, czy w przypadku frazy złożonej z kilku słów, muszą one znaleźć
się obok siebie w podanej przez niego kolejności, czy kolejność ich jest
dowolna, oraz czy słowa mogą znajdować się w pewnej (zadeklarowanej)
odległości. Funkcjonalność ta jest dostępna dla użytkownika w obszarze DOPASUJ
ODLEGŁOŚĆ
. Tryb dokładny to tryb, w którym SkryBot wyszukuje słowa
podane we frazie dokładnie w takiej kolejności w jakiej zostały zadeklarowane
przez użytkownika.

 

Rys. 24 Praca w
trybie wyszukiwania fraz

Jeśli użytkownik
dopuszcza możliwość, że słowa w zadanej przez niego frazie rozdzielone są przez
inne słowa, powinien zaznaczyć opcję Wyszukiwanie w oknie oraz określić
wielkość okna. Przez okno rozumiemy długość frazy liczoną w słowach. Dla
wyjaśnienia zasady działania tej opcji załóżmy, że użytkownik w oknie Wyszukaj
wpisał „będzie prawa”. W zdaniu: „Starosta będzie mógł podjąć
postępowanie o zatrzymaniu prawa jazdy.” Słowa „będzie” oraz „prawa”
znajdują się w oknie o wielkości 7(słów). Jeśli Skrybot będzie miał zadane wyszukiwanie
w/w słów w oknie mniejszym niż 7, przytoczone zdanie nie znajdzie się w
wynikach wyszukiwania dla zadeklarowanego wyrażenia, ponieważ okno nie obejmie
jednocześnie w/w słów.

Z chwilą, gdy
wybrany został folder przeznaczony do przeszukania i tryb wyszukiwania
(dokładny lub przybliżony), a w oknie Wyszukaj wpisano jakie słowo/fraza
ma być znalezione przez SkryBota, należy kliknąć na przycisk Rozpocznij
wyszukiwanie.
Wyszukiwanie może być w każdej chwili zatrzymane (przycisk Zatrzymaj
wyszukiwanie
). Wyniki wyszukiwania pojawią się w postaci nazwy pliku, w
którym SkryBot znalazł zadane (lub podobne) słowa, czasu wystąpienia tego słowa
w nagraniu oraz określenia znalezionego słowa. W oknie tekstowym z prawej
strony wyników wyszukiwania, po dwukrotnym kliknięciu na jeden z wyników pojawi
się tekst, w którym znalezione zostało zadane słowo/fraza wraz z czasem jego
wystąpienia w nagraniu. Jednocześnie SkryBot rozpocznie odtwarzanie wybranego
pliku od miejsca, w którym znalezione zostało słowo/fraza. Użytkownik może
dostosować ilość słów w oknie tekstowym poprzez regulację wielkości okna
liczoną (w tym przypadku) w sekundach. Wybór liczby 1 oznacza, że na
ekranie wypisany zostanie tekst odpowiadający jednej sekundzie nagrania, wybór
liczby 10 oznacza, że ilość wypisanych słów będzie odpowiadała dziesięciu
sekundom nagrania.

Rys. 25 Wyszukiwanie
fraz złożonych w wielu słów – wyszukiwanie w oknie

Wybór
opcji Scal rezultaty spowoduje wyświetlenie wyników wyszukiwania z
podziałem na pliki, w których zostały znalezione zadane słowa, w sposób
pokazany na rys. 26.

Rys. 26 Scalone
rezultaty wyszukiwania

14
Tyb prezentacji

Pracując
ze SkryBotem użytkownik może edytować nagrania korzystając z trybu prezentacji.
Opcja ta dostępna jest w zakładce Narzędzia po naciśnięciu przycisku Prezentacja.

Rys. 27 Tryb
Prezentacji

W trybie
prezentacji możliwa jest praca zarówno z plikami, które SkryBot wcześniej już
rozpoznał, jak i z plikami nie poddanymi obróbce w SkryBocie.  W tym trybie
można śledzić oscylogram pliku dźwiękowego oraz dokonać edycji pliku poprzez
wycięcie zaznaczonego fragmentu klikając na przycisk wytnij. Zmiany można cofnąć za pomocą przycisku cofnij.

Aby umożliwić
dostosowanie trybu Prezentacji do wymagań użytkownika, SkryBot
udostępnia szereg opcji.


I.
Obszar
powiększenie
:

1.
Pow.
Poziome

– po kliknięciu na „+” powiększany jest widok oscylogramu w zakresie amplitudy
dźwięku. Wartość można zmniejszyć klikając „-”.

2.
Wartość
ze znakiem

– następujące po sobie próbki dźwięku zobrazowane są na oscylogramie
naprzemiennie, raz z dodatnią raz z ujemną amplitudą.

 

Rys. 28 Wartości ze
znakiem

3.
Wartości
absolutne

oscylogram przedstawia wartości dodatnie amplitudy dźwięku wraz z ich lustrzanym
odbiciem w miejscu amplitudy o wartości ujemnej

 

Rys. 29 Wartości
absolutne

4.
Ze
znacznikami słów –
na
ekranie pojawiają się znaczniki obrazujące początek i koniec każdego ze
słów oraz obszarów ciszy.

5.
Z
napisami

pomiędzy znacznikami słów widoczne są słowa jakie wystąpiły w danym czasie
nagrania. Opcja ta jest dostępna jedynie razem z włączoną opcją Ze znacznikami
słów.
Pojawienie się danego słowa pod oscylogramem jest uzależnione od tego,
jakie powiększenie poziome zostało wybrane przez użytkownika. Przy małych
powiększeniach, pomiędzy znacznikami danego słowa odległość może być zbyt mała,
by w tym miejscu na ekranie monitora mogło się pojawić słowo. Zalecamy
korzystanie z tej opcji po odpowiednim dostosowaniu powiększenia poziomego.

     II.
Obszar szczegóły w tym miejscu dostępne są dane dla
wybranego przez użytkownika czasu nagrania. Przesuwając kursorem myszki po
oscylogramie, uruchamiamy znacznik w postaci pionowej, białej linii. Zmiana
pozycji znacznika, powoduje wyświetlenie w oknach dialogowych tego obszaru
danych dotyczących danego elementu nagrania. Wymienione powyżej informacje
pojawiają się również w trakcie odtwarzania, pozwalając na śledzenie
szczegółów nagrania na bieżąco.

1.     Próbka – informuje o tym która z kolei próbka
nagrania została zaznaczona

2.     Czas – wyświetla dokładny czas
wystąpienia danej próbki w nagraniu w formacie hh:mm:ss.ms

3.     Milisekundy – wyświetla czas wystąpienia próbki
w nagraniu liczony w milisekundach.

4.     Słowo  – dostarcza informacji, o tym jakie
słowo występuje w danym miejscu nagrania. Pozwala to na śledzenie wysąpienia
poszczególnych słów w nagranym pliku bez konieczności powiększania
oscylogramu, do rozmiarów umożliwiających wyświetlenie danego słowa pomiędzy
znacznikami słów.

    III.
Przyciski
(w prawym górnym roku okna)

1.     otwórz audio ­
wybór pliku dźwiękowego
z katalogu wskazanego przez użytkownika

2.     odtwórzodtwarza plik od początku do końca
zaznaczonego obszaru nagrania – można również użyć do tego celu klawisza
spacji.

3.     wytnij – usuwa zaznaczony fragment nagrania.

4.     auto – automatycznie wykrywa długie
obszary ciszy w nagraniu i usuwa je. Wybór tej opcji wiąże się z koniecznością poddania
nagrania ponownemu procesowi rozpoznawania, w związku z tym, że czasy
wystąpienia poszczególnych słów po usunięciu ciszy ulegną zmianie. O tym fakcie
użytkownik będzie informowany każdorazowo po wykonaniu automatycznego usuwania
obszarów ciszy.

5.     odt. całość – odtwarza plik od początku, bez względu na to czy i
gdzie ustawione było zaznaczenie części nagrania.

6.     cofnij przywraca stan pliku sprzed
dokonania w nim ostatniej zmiany.

7.     zapisz  – zapisuje plik na dysku, w
wybranym przez użytkownika katalogu.

Poniżej
oscylogramu znajdują się przyciski odtwarzacza oraz suwak umożliwiający
śledzenie postępu odtwarzania, jak również zdecydowanie od którego momentu
nagrania plik ma zostać odtworzony. Nagranie można zatrzymać w dowolnej
chwili. Przewijanie w przód i wstecz może być dokonywane skokowo o
określoną przez użytkownika ilość sekund. Służą do tego przyciski „+”  i  „-”  rys.
30.

Rys. 30 Przyciski
odtwarzacza – określenie szybkości przewijania nagrania

Rys. 31 Tryb
prezentacji – ustawienia

W dolnej
części okna SkryBota widoczny jest tekst – Rys. 31. Pojawia się on tylko dla
plików dźwiękowych rozpoznanych wcześniej przez SkryBota. Ilość wyświetlonych słów
zależy od ustawienia wartości z prawej strony okna tekstowego. Determinuje
ona wielkość przedziału czasu z jakiego wyświetlone zostaną słowa. Na przykład
wybór wartości 10, oznacza, że SkryBot będzie w trakcie odtwarzania pliku wyświetlać
tekst odpowiadający 10 sekundom nagrania.

W celu
zapobiegania sytuacji, gdy użytkownik przez pomyłkę edytuje nieodpowiedni plik,
istnieje możliwość sprawdzenia tego z jakim plikiem aktualnie pracuje użytkownik.
Ścieżka dostępu do otworzonego pliku jest widoczna poniżej odtwarzacza.

15     Aktualizacja SkryBota

Gdy komputer jest podłączony do Internetu, SkryBot co jakiś czas sprawdza czy jest dostępna aktualizacja i o tym informuje.

Użytkownik może również samodzielnie sprawdzić czy jest dostępna aktualizacja i uruchomić
ją klikając w zakładce Narzędzia przycisk Aktualizacje.

Instalacja aktualizacji polega na całkowitym usunięciu oprogramowania SkryBot przez Panel
sterowania / Odinstaluj program
i ściągnięciu nowej wersji z linku, który podał
SkryBot po poinformowaniu o istniejącej aktualizacji.

  

16    Wielokanałowe nagrywanie i rozpoznawanie SkryBotem

Do wielokanałowego nagrywania służy program Multitrack Microphone USB Recorder, który w trakcie uruchamiania wykryje podłączone mikrofony. Program działa w systemach Windows Vista, Windows 7, Windows 8, 8.1, Windows 10 i nagrywa dźwięk z każdego
mikrofonu USB w osobnej ścieżce audio Wave.

Przed przystąpieniem do nagrywania należy upewnić się, że mikrofony są podłączone w systemie. Należy to zrobić przez zasobnik systemowy Ustawienia Nagrywania / Pokaż urządzenia wyłączone /  Włącz wszystkie mikrofony USB.

Dzięki separacji sygnału z mikrofonów USB, zapisany dźwięk zostanie w całości poddany
dekodowaniu bez ryzyka utraty danych, nawet jeśli osoby będą sobie wchodzić w
słowo w czasie rozmowy. SkryBot automatycznie oznaczy osobne ścieżki audio
wave jako osobnych mówców, a dzięki funkcji Wykrywanie mówców
zsynchronizuje rozpoznany tekst do jednego pliku z oznaczeniem
mówców/mikrofonów.

Dla pełnej separacji sygnału zaleca się użycie tzw.
mikrofonów gardłowych.

 

17     Wyłączenie SkryBota

SkryBota można wyłączyć na trzy sposoby:

1.
Klikając na X w prawym górnym rogu – opcja dostępna po modyfikacji ustawień ogólnych SkryBota (Rozdział
8.1 Konfiguracja główna
)

2.
W zasobniku systemowym kliknij prawym przyciskiem myszy na oczko SkryBota potem wybierz Wyjdź.

3.
Można też
wyłączyć przez Menadżera Zadań Windows (Ctrl+Alt+Del) wyłącz proces: Skrybot.app.exe.

 

18
Informacje dodatkowe

Bezpłatne,
demonstracyjne wersje testowe

https://sourceforge.net/projects/skrybotdomowy/files/Releases/

Informacja
o innych wersjach SkryBota

https://skrybot.pl/produkty/

Jak używać
SkryBota

https://youtu.be/kZGIVLDZTsU

Jak
poprawiać rozpoznawanie

https://youtu.be/zwm2TyMDs_c

Informacja
o nagrywaniu wielokanałowym z użyciem SkryBota

https://skrybot.pl/wiadomosci/wielokanalowe-nagrywanie-i-rozpoznawanie-mowy-skrybot/

Filmy instruktażowe

Kanał
YouTube poświęcony SkryBotowi

Zgłaszanie
błędów programu

http://sourceforge.net/p/skrybotdomowy/bugs/
lub e-mailem

19     Wiadomości RSS

Dostęp do wiadomości RSS zapewnia przycisk RSS w zakładce Narzędzia. Ponadto program wyświetla w trakcie działania informacje na temat aktualizacji oprogramowania SkryBot w postaci dymków, z przerwą 30 sekund pomiędzy nimi. Wyświetlanie dymków można zablokować w Konfiguracji programu.

20     Wysyłanie plików do Przepisywanie.pl

Aby otrzymywać 100% dokładne przepisane nagrania, wybierz www.Przepisywanie.pl

Po kliknięciu w link http://Przepisywanie.pl na oknie głównym SkryBota połączysz się ze stroną przeznaczoną do wysyłania plików do serwisu przepisywanie.pl – najdokładniejszego przepisywania nagrań do plików tekstowych (Rys.31).

Po wpisaniu swoich podstawowych danych na stronie i kliknięciu przycisku Zapisz, otrzymasz mailem dostęp do panelu klienta, przez który można wysyłać pliki z nagraniami i otrzymywać teksty.

Rys. 32   Strona
internetowa przepisywanie.pl

21     Własność oprogramowania

Producentem oprogramowania SkryBot DoMowy jest Przepisywanie.pl sp. z o.o.

Adres korespondencyjny:

Przepisywanie.pl sp. z o.o.

ul. Czerniakowska 159

00-453 Warszawa

telefon +48 790 013 206

przepisywanie@gmail.com; skrybot@gmail.com; poczta@przepisywanie.pl

http://przepisywanie.pl Przepisywanie nagrań ze słuchu 100% dokładności.

www.SkryBot.pl Centrum technologii rozpoznawania mowy: www.SkryBot.pl   

www.SkryBot.tv Rozpoznawanie mowy przez Internet: www.SkryBot.tv

 


[1] Zależnie od wersji SkryBota i umowy. Dla specjalistycznych zastosowań możemy zastosować indywidualne rozwiązania licencjonowania, łącznie z instalacją u klienta serwera licencjonującego.

Are you interested in speech recognition? Subscribe to our newsletter by adding your e-mail address here:
Confidentiality
E-mail addresses obtained by the help of this form will be used solely for the purpose of providing information regarding the development of skryBot - speech recognition and decoding software.