Procurando o melhor software livre de voz do Windows para texto? A recomendação paga mais repetida é o Dragon Naturally Speaking (DNS). Mas alguns podem zombar de pagar por software. Felizmente, existem vários programas gratuitos, como o Google Docs Voice Typing (GDVT) e o Windows Speech Recognition (WSR).
Princípios Básicos do Dragon NaturallySpeaking 13 Princípios Básicos do Dragon NaturallySpeaking 13 Compre Agora Na Amazon $ 29.84
Você pode se perguntar como esses dois produtos se comparam ao DNS - e se o DNS atende ou não às suas necessidades. Para este artigo, identifiquei três tipos de usuários: aqueles que precisam de transcrição de fala para texto para escrever romances, aqueles que precisam de transcrição acadêmica e aqueles que escrevem documentos de negócios, como memorandos. Para este fim, eu testei três programas de transcrição de fala (DNS, GDVT e WSR).
Configuração de Transcrição de Discurso
Antes de entrarmos no teste, vamos primeiro examinar a configuração recomendada de hardware e software.
Requisitos de Hardware e Software
A digitação por voz do Documentos Google requer o navegador Chrome e um microfone. E também precisa de uma conexão de internet persistente (que não é mencionada nos requisitos). Caso contrário, este é provavelmente o método mais fácil para começar a transcrição de fala.
O DNS requer um processador fabricado em 2001 ou posterior, o Windows 7 ou posterior e cerca de 4 GB de armazenamento gratuito. Sua exigência mais rigorosa é de 2 GB de RAM. Aqui está uma lista completa dos requisitos de hardware do DNS.
Reconhecimento de fala do Windows Habilite fala para texto e controle de voz configurando o reconhecimento de fala no Windows Habilite fala para texto e controle de voz configurando o reconhecimento de fala no Windows O reconhecimento de fala permanece mais poderoso do que o Cortana. Ele direciona a fala para o controle de texto e voz. Este artigo mostrará o que o Reconhecimento de Fala pode fazer, como configurá-lo, treiná-lo e usá-lo. O Read More, também conhecido como Speech Platform Runtime (download WSR), não custa nada e requer apenas um sistema operacional Windows 7 ou posterior.
Considerações sobre Microfone
Eu uso um microfone dinâmico (melhor microfone para podcasting O melhor microfone podcast para seu dinheiro em 2017 O melhor microfone podcast para seu dinheiro em 2017 Microfones importam muito ao fazer um podcast. Os custos iniciais são bastante baixos: software de gravação, desktop ou laptop, e, claro, um microfone.Então, qual é o melhor microfone de podcast? Leia mais) e um processador relativamente rápido Intel Core i7. Enquanto um microfone de alta qualidade é desejado, não é necessário. Mesmo assim, seus resultados melhorarão com melhor qualidade de som e ruído de fundo reduzido.
O microfone com preço mais baixo que eu recomendaria para gravação de alta qualidade é o Audio-Technica ATR-2100. No entanto, a diferença de precisão entre o microfone de US $ 5 e um dispositivo de US $ 200 é mínima.
Audio-Technica ATR2100-USB Cardioide Dinâmico Microfone USB / XLR Audio-Technica ATR2100-USB Cardioide Dinâmico USB / Microfone XLR Compre Agora Na Amazon $ 74.10
Por outro lado, os requisitos mínimos para o Microsoft Speech são praticamente todos os computadores remotamente modernos (a maioria dos computadores feitos nos últimos dez anos) e um microfone. Se você possui um laptop ou tablet feito nos últimos cinco anos, ele deve ter o que você precisa por padrão.
Configurando Programas de Transcrição de Fala
Veja como usar a digitação do Google Voice:
Veja como começar a usar o Reconhecimento de Fala do Windows:
E, finalmente, aqui está como começar com o Dragon Naturally Speaking:
Metodologia de Teste
Eu quero encontrar o melhor discurso baseado em Windows livre para o aplicativo de texto. Porque diferentes consumidores podem precisar de um produto diferente, eu criei um teste simples. Li três passagens diferentes de textos sem direitos autorais: uma de Charles Darwin, sobre a tendência das espécies para formar variedades . Um do Call of Cthulu de HP Lovecraft. O último vem do discurso de Jerry Brown sobre o estado da união de 2017. Minha metodologia não é perfeita, mas dá uma impressão das precisões de cada suíte de reconhecimento de voz.
Amostra de Escrita de Ficção (De Call of Cthulu de HP Lovecraft)
“A coisa mais misericordiosa do mundo, penso eu, é a incapacidade da mente humana de correlacionar todo o seu conteúdo. Vivemos em uma ilha plácida de ignorância no meio dos mares negros do infinito, e isso não significa que devemos viajar para longe. As ciências, cada uma esforçando-se em sua própria direção, até agora nos prejudicaram pouco; mas, algum dia, a junção do conhecimento dissociado abrirá visões aterrorizantes da realidade e de nossa assustadora posição, de que ou enlouqueceremos da revelação ou fugiremos da luz mortífera para a paz e a segurança de uma nova era das trevas. .
Amostra de Redação Comercial (Discurso do Estado da União de Jerry Brown 2017)
“É costume, em uma ocasião como essa, traçar uma agenda específica para o próximo ano. Seis vezes antes desta tribuna, fiz isso e com algum detalhe. E, quando releio essas propostas apresentadas em discursos anteriores do Estado dos Estados, fiquei surpreso ao ver o quanto conseguimos juntos. ”
Amostra de Escrita Acadêmica (de Charles Darwin Sobre a Tendência das Espécies para Formar Variedades )
“Agora, quando ocorre uma variedade de tal animal, tendo maior poder ou capacidade em qualquer órgão ou sentido, esse aumento é totalmente inútil, nunca é chamado à ação e pode até existir sem que o animal se torne consciente disso. No animal selvagem, pelo contrário, todas as suas faculdades e poderes sendo postos em plena ação pelas necessidades da existência, qualquer aumento torna-se imediatamente disponível, é fortalecido pelo exercício e deve até mesmo modificar ligeiramente a comida, os hábitos e o todo. economia da corrida ”.
3 suites de transcrição de voz testadas
É surpreendente como reconhecimento de voz livre Os melhores aplicativos de criação de lista para comandos de voz Os melhores aplicativos de criação de lista para comandos de voz Muitas ferramentas gratuitas de produtividade oferecem suporte a voz em texto para listas. Mostraremos os melhores aplicativos de criação de listas com reconhecimento de voz e comandos que você deve tentar. Leia Mais testes realizados com software pago. Mas no final do dia, o aplicativo mais preciso é o Dragon Naturally Speaking. No entanto, tanto o Google Voice Typing quanto o Windows Speech Recognition não custam nada e oferecem mais de 90% de precisão. Mas cada um tem seus pontos fortes e fracos e você pode preferir um sobre o outro.
HP Lovecraft (Teste de Escrita de Ficção)
Lovecraft adorava escrever em prosa longa, ininterrupta e entre parênteses. Enquanto as três suítes fazem um ótimo trabalho ao transcrever com precisão o texto vocalizado de Lovecraft, o DNS sai à frente de seus concorrentes . Inclui tanto a capitalização quanto a pontuação (o que é completamente insano).
DNS: DNS só soltou uma única palavra do texto. No geral, marcou 107 corretos de 108 palavras. Ele pregou várias frases longas e ininterruptas também.
WSR: O Windows fez um ótimo trabalho - mas não foi incrível - de transcrever Lovecraft. Ficou em torno de 97 de cerca de 108 palavras corretas. Enquanto isso está aquém do GDVT e do DNS, ainda é bom para um programa de texto livre que não requer acesso online.
GDVT: Não sei o que aconteceu porque o Google acertou a transcrição para os outros trechos. O GDVT atingiu apenas 103 em 108, soltando duas palavras e errando três. Ele até mesmo soletrou "ponto e vírgula" ao invés de inserir a pontuação correta. Também capitalizou certas palavras, transformando-as em nomes próprios (mas não vou penalizá-las, uma vez que é a precisão e não a capitalização que importa).
Tenho certeza de que, se eu reler o documento uma segunda vez, não haverá erros.
Charles Darwin (Teste de Escrita Científica ou Acadêmica)
Darwin escreve, como Lovecraft, frases longas carregadas de informações entre parênteses. No entanto, seu uso da linguagem é muito claro e ele não usa quase nenhum jargão, o que difere da quase incompreensível escrita científica hoje.
DNS: O texto de Darwin sai quase perfeito no Dragon Naturally Speaking. O DNS digitou apenas uma palavra (“em”) e, de outra forma, acertou completamente o teste com 87 palavras em 88.
WSR: A Microsoft fez um ótimo trabalho, combinando 82 de 88 palavras. Ele fez alguns erros relativamente bizarros, no entanto, como soletrando "sentido" como "centavos".
GDVT: O Google fez muito bem no trecho de Darwin. O GDVT apenas derrubou duas palavras, de 88. No geral, para um aplicativo gratuito, você não consegue encontrar uma alternativa mais precisa.
Jerry Brown Estado do Estado Endereço de 2016 (Business Writing Test)
O discurso de Brown não usa muitas frases complicadas ou vocabulário (além da palavra “rostro”). No geral, a maioria dos serviços de transcrição foi executada de forma surpreendente. Mais ou menos, se você precisar de um serviço que lide com sentenças simples e vocabulário limitado, qualquer um deles funciona muito bem.
DNS: o DNS marcou o endereço do estado do estado de Brown. Enquanto caiu um período, caso contrário, ficou cada palavra perfeitamente. Note, no entanto, que os discursos políticos muitas vezes carecem do tipo de linguagem complexa que você pode ver na ficção ou na academia. Um memorando ou discurso é direto e direto ao ponto. Isso é algo que um cliente de reconhecimento de fala não deve ter problemas em lidar.
WSR: O Windows Speech Recognition fez um ótimo trabalho - embora não tão bom quanto o DNS ou o Google - ao transcrever o discurso de Brown. Ele marcou 55 de 58 palavras. Até reconheceu a palavra “rostro”, que eu nem sabia que era uma palavra, nem sabia como pronunciá-la. Aparentemente, ou eu entendi direito ou a tecnologia de reconhecimento de fala pode até pegar erros de pronúncia.
GDVT: O software de transcrição do Google registrou a transcrição com 100 por cento de precisão. Ele ainda conseguiu capitalizar corretamente "State of the State", sem precisar de entrada do usuário. É estranho usar o número, em vez da grafia, para a palavra "seis". O que resultou em um erro estilístico.
Os serviços gratuitos de transcrição valem a pena ser usados?
Há uma diferença entre o Dragon Naturally Speaking, o Google Voice Typing eo Windows Speech Recognition. O dragão é mais preciso que seus concorrentes. No entanto, o melhor programa gratuito em termos de precisão é - por uma margem estreita - a Voice Typing do Google. Embora os serviços de transcrição da Microsoft e do Google sejam menos favoráveis ao DNS, eles não custam US $ 30.
Contrastando os dois serviços gratuitos uns contra os outros, o Google oferece melhor precisão de reconhecimento de voz, pontuação e caso, requer uma conexão com a internet. O Google também captura muito do que você não pretende, como pontuação e uso de maiúsculas.
No entanto, se você quiser um programa de transcrição gratuito que você não precisa de uma conexão com a Internet para usar, o Reconhecimento de Fala do Windows se encaixa na conta que o Windows pode fazer ISTO? 15 características surpreendentes que você não tinha idéia sobre o Windows pode fazer isso? 15 Recursos surpreendentes que você não tinha idéia O Windows pode fazer muito mais do que você imagina. Mesmo se você for um usuário veterano do Windows, aposto que você descobrirá um recurso em nossa lista que você nunca soube que existia. Consulte Mais informação . Não é de modo algum ruim e oferece 90% do que o Dragon Naturally Speaking oferece. Dê um tiro se você não tiver já.
Qual é o seu serviço de transcrição favorito? Por favor deixe nos saber nos comentarios!