Como a digitação por voz é o novo melhor recurso do Google Docs

O reconhecimento de voz melhorou aos trancos e barrancos nos últimos anos. No início desta semana, o Google finalmente introduziu a digitação de voz no Google Docs. Mas isso é bom? Vamos descobrir!

O reconhecimento de voz melhorou aos trancos e barrancos nos últimos anos.  No início desta semana, o Google finalmente introduziu a digitação de voz no Google Docs.  Mas isso é bom?  Vamos descobrir!
Propaganda

O reconhecimento de voz costumava ser terrivelmente impreciso. Só funcionou para um punhado de pessoas um punhado dos tempos. Mas agora é realmente muito bom, graças aos esforços combinados da Nuance, Microsoft, Apple e Google, que lançaram inúmeros recursos para realmente melhorá-lo.

De todas essas empresas, poucas corresponderam ao compromisso de expressar o reconhecimento do Google, que o transformou em peça fundamental de sua estratégia de serviços e dispositivos móveis.

Uma das primeiras incursões do Google foi a curta duração do GOOG-411 (ou Google Voice Local Search). Foi lançado em 2008 e permitiu que as pessoas pesquisassem números de telefone comerciais usando sua voz. Tecnologia de reconhecimento de voz também tem sido uma peça central do Android, e com o lançamento do JellyBean Quais são as maiores melhorias no Android 4.2 e 4.3? Quais são as maiores melhorias no Android 4.2 e 4.3? Se você está preso em 4.0 Ice Cream Sandwich ou 4.1 Jelly Bean, você deve atualizar? Leia mais finalmente ficou disponível offline.

No início desta semana, o Google finalmente introduziu o reconhecimento de voz no Google Docs.

Os usuários podem literalmente ditar seus documentos (como eu estou fazendo com este artigo) sem a necessidade de instalar qualquer software ou plug-ins adicionais. É um salto significativo para a suíte de escritório on-line, mas é bom?

Começando

Antes de começar a mergulhar em seus recursos, quero abordar como você obtém a digitação do Google Voice. Se você tem uma conta do Google, você já tem isso. Basta abrir o Google Docs e abrir um documento novo ou existente. Em seguida, uma janela será exibida perguntando se você deseja tentar o ditado de voz. Clique em Experimente .

GoogleVoiceTypingTry

Em seguida, você precisa conceder permissão ao Google Docs para usar seu microfone. Isso é apenas uma questão de clicar em Permitir para uma janela pop-up.

MicrophonePermission

Em seguida, você deve selecionar o idioma que deseja usar com o Google Voice Typing. A variedade de idiomas e dialetos oferecidos varia de inglês e espanhol a africâner e árabe.

Screen Shot 2016-02-25 às 10.14.12

Então, basta clicar no ícone do microfone e começar a falar.

Quão preciso é isso?

Um dos maiores obstáculos para o reconhecimento de voz no mainstream é que muitas vezes não é preciso o suficiente . Costumava ser um dado que se você vir usar o reconhecimento de voz, você terá que passar algumas horas editando e corrigindo seu texto. Então, como a oferta do Google se comporta a esse respeito?

Bastante favoravelmente, na verdade . Na maioria das vezes, o Google Voice Typing entendeu o que eu disse, embora eu tenha um sotaque regional em inglês ( falaremos sobre os acentos depois ).

GoogleVoiceOn

Fiquei especialmente impressionado com a maneira como o reconhecimento de voz do Google lidou com o ruído de fundo. Enquanto escrevia este artigo, um Yorkshire Terrier latia na minha sala e minha janela estava parcialmente aberta. Eu moro em uma estrada movimentada onde os carros passam constantemente. Mas, apesar disso, o Google conseguiu filtrar isso e se concentrar apenas no que eu estava dizendo.

O maior problema foi o Google Voice Typing, muitas vezes lutando com pontuação. Eu diria “vírgula”, “ponto final” e “ponto final”, e interpretaria isso como eu querendo escrever “vírgula”, “ponto final” e “ponto final”. Isso foi frustrante por dois motivos.

Ponto final

Em primeiro lugar, porque me provocaria, primeiro usando a pontuação correta, antes de reverter imediatamente para a versão escrita da palavra. Não havia como parar isso e eu teria que editar manualmente o documento para corrigi-lo.

Mas, talvez pior, não consegui impedir que isso acontecesse. Não há dicionário onde você possa substituir a ortografia. Acontece e você tem que lidar com isso.

Eu não quero subestimar o quão frustrante isso é. É seriamente irritante . Mas também é algo que acredito que será aprimorado à medida que mais e mais pessoas usarem esse recurso e que o Google dedique mais recursos à melhoria do reconhecimento de voz.

Além disso, fiquei muito satisfeito com a precisão do reconhecimento de voz do Google.

Como lida com acentos

Fiquei impressionado com a quantidade de idiomas e dialetos que o Google Voice Typing oferece. Somente em inglês, ele suporta os dialetos da Nova Zelândia, Austrália, Índia, África do Sul, América e Britânico, para citar apenas alguns. O problema é que não há realmente um sotaque americano, assim como não há um sotaque britânico. Em vez disso, há uma variedade de sotaques e dialetos que diferem de um lugar para outro.

É um truísmo que o Reino Unido tenha um sotaque para cada post-code. A equipe MakeUseOf possui uma variedade de sotaques diferentes entre os funcionários britânicos. Christian Cawley fala com um amplo sotaque Middlesbrough. Rob Nightingale, que vem de Southport, tem um sotaque mais norte. Enquanto Mark O'Neil tem um sotaque escocês.

Eu moro em Liverpool, então tenho um sotaque de Scouse que vagueia levemente para o Atlântico, em grande parte graças à minha noiva americana e ao tempo que passei morando na Suíça.

E é justo dizer que os programas de reconhecimento de voz muitas vezes lutam para entender os dialetos regionais da Inglaterra. Quando Siri saiu, por exemplo, sua incapacidade de entender os usuários escoceses se tornou uma piada.

Mas a oferta do Google foi excepcional. Acredite em mim quando digo que você não terá que praticar falando com um sotaque diferente. Que aplicativos e websites ajudarão a melhorar meu sotaque quando falo outro idioma? Quais aplicativos e sites ajudarão a melhorar meu sotaque quando falo outro idioma? Eu realmente quero fazer a minha pronúncia coincidir com a de um falante nativo. Existem aplicativos ou sites que podem me ajudar? Consulte Mais informação . Falei com um punhado de amigos que também têm sotaques regionais em inglês e tiveram experiências igualmente positivas com ele. Embora admita que é uma amostra pequena e completamente não científica, certamente é promissora.

Velocidade de ditado de voz

Tradicionalmente, os programas de reconhecimento de voz são prejudicados pela incapacidade de acompanhar a velocidade que o usuário determina. Evidentemente, fiquei um pouco preocupado que a oferta do Google não fosse diferente, especialmente porque é um serviço online, e não um programa em execução no meu MacBook Pro.

Mas fiquei impressionado. O Google conseguiu acompanhar meu ritmo de fala altamente cafeinado e não funcionou como um obstáculo à minha produtividade. Foi o completo oposto das minhas experiências com outras ferramentas de ditado de voz.

VoiceRecognitionSpeed

Eu não sei se isso foi porque eu tenho um rápido FTTC (Fibra para o Gabinete) Qual é a diferença entre FTTC e FTTP e por que você deve se importar? Qual é a diferença entre FTTC e FTTP e por que você deve se importar? Todos nós já estivemos lá em um momento ou outro. Doente do nosso serviço de Internet, procurando por uma nova maneira de se conectar à Internet, mas confuso com as muitas opções diferentes. Leia Mais conexão doméstica à Internet, ou o fato de que o Google tem um suprimento ilimitado de servidores rápidos à sua disposição. De qualquer forma, eu consegui fazer as coisas.

Uma nota sobre microfones

Microfones embutidos tendem a ser hit-and-miss. Na minha experiência, eles são excelentes, como se estivessem nos laptops da Apple ou não. Há muito raramente qualquer meio termo.

Como regra geral, os laptops mais baratos Melhor Laptops em US $ 300: Tudo que você precisa saber Melhor Laptops em US $ 300: Tudo que você precisa saber Encontrar um bom laptop por menos de US $ 300 é quase impossível nos dias de hoje, mas pode ser feito se você sabe o que procurar. Aqui está tudo o que você precisa saber para fazer uma compra ... Read More terá os piores microfones internos. É apenas um desses recursos que tendem a ser negligenciados pelos fabricantes de dispositivos.

Comecei a ditar este artigo usando o microfone interno do meu MacBook Pro. Embora o Google Docs frequentemente dissesse que estava tendo problemas para me ouvir, isso não se traduzia em ditado mais lento ou impreciso. Tudo funcionou bem.

Também experimentei o Google Voice Typing com um caro Blue Yeti External Microphone. Estes são microfones de qualidade de podcast que vendem na Amazon por mais de US $ 100.

Microfone USB Yeti Azul - Silver Blue Microfone Yeti USB - Prata Compre Já Na Amazon $ 110.00

Evidentemente, não notei diferenças quando se tratou da precisão ou da velocidade do ditado. No entanto, a maior vantagem de usar este microfone foi que eu pude inserir um par de fones de ouvido AKG e usá-los como um monitor. Isso permitiu que eu fosse mais consciente do ruído de fundo e me auto-ajustasse se estivesse sendo muito barulhento ou quieto demais.

Pensamentos finais

O reconhecimento de voz do Google não é perfeito. Mas isso dificilmente é uma surpresa, já que um reconhecimento de voz sólido é uma tarefa bem difícil de se conseguir. Há muita coisa que senti que poderia ser melhorada.

Isso se concentra principalmente em como o software lida com pontuação e estrutura de sentença. Em um mundo ideal, o Google insere automaticamente a pontuação com base no ritmo e na cadência de sua voz, mas estamos muito longe disso.

Também é uma pena que este software ainda não tenha entrado nas outras ofertas do Google, como o Gmail. Idealmente, gostaria de ter a oportunidade de baixar o Google Voice Typing como um aplicativo e usá-lo com outros softwares, como o iWork Pages Pages 5.0 para Mac, incluindo o Smart Inspector Panel, mas menos recursos, Páginas 5.0 para Mac, incluindo o Smart Inspector Panel. Mas menos recursos Há uma abundância de editores de texto leves e fáceis de usar para usuários de Mac, mas para projetos que exigem recursos de editoração eletrônica, as Páginas recentemente revisadas da Apple ainda são uma boa solução. Leia mais ou o editor de redação IA Writer iA Writer para Mac e iOS: o melhor processador de texto que você nunca usou iA Writer para Mac e iOS: o melhor processador de texto que você nunca usou Seja um jornal da escola ou um blog, Todos nós em algum momento nos encontramos na posição de ter que despejar um monte de caracteres em um arquivo de texto. Enquanto celular ... Leia Mais.

Mas esses são dois aborrecimentos menores, o Google Voice Typing é tão bom quanto parece. Por contraste, eu escrevi esta seção do artigo usando o reconhecimento de voz integrado do OS X, e não foi nem de perto tão preciso, nem tão rápido.

Se isso não convencer as pessoas a mudar para o Google Drive, não sei o que acontecerá.

Agora para você! Você foi tentado pelo reconhecimento de fala do Google Drive? Você já tentou, ainda? Conte-me tudo sobre isso nos comentários abaixo.

In this article