O arquivo é uma das partes fundamentais da experiência de computação. Mas o que é um "arquivo" de qualquer maneira? É um ícone em sua área de trabalho, uma entrada em uma lista que abre seu orçamento como uma planilha e um nome que você pode dar à sua selfie mais recente. No final do dia, um “arquivo” é uma coleção de bits (zeros e uns) dispostos em um padrão que alguns aplicativos entendem.
Os desenvolvedores podem manter esses padrões em segredo, o que pode fazer com que os usuários mantenham um programa em particular, apesar de alternativas. Se você já converteu um arquivo de texto, como PDF para Word, está familiarizado com o desafio. Às vezes é tão fácil quanto imprimir, outras vezes você precisa de ferramentas especiais. Digite este guia do conversor. Consulte Mais informação . Outros desenvolvedores podem realmente incentivar a adoção de seus formatos. Em alguns casos, você pode abrir e interpretar facilmente o formato ou pode ser impossível usá-lo fora de seu aplicativo nativo. Vamos explorar exemplos de todos os itens acima neste artigo.
Formatos de arquivo baseados em texto e binários
O primeiro aspecto importante de diferentes tipos de arquivos é se é binário ou baseado em texto. Vamos olhar para cada um deles por sua vez.
Formatos baseados em texto
O arquivo de texto é o formato de arquivo mais básico. Ele pode ser lido por praticamente qualquer sistema com um processador. Este formato é uma seqüência de bits (uns e zeros) que adere ao padrão ASCII (vamos ignorar Unicode no momento), o que significa que um computador pode interpretar cada byte (8 bits) como um caractere entre os seguintes:
- AZ (incluindo maiúsculas e minúsculas
- 0-9
- Personagem do espaço
- Uma seleção de símbolos (por exemplo, pontuação)
- Caracteres de controle (por exemplo, "DEL")
Como os dados são armazenados como texto, você pode visualizar o conteúdo de um arquivo abrindo-o em um editor de texto, até mesmo os simples editores de texto minimalistas do Windows Notepad 2 que você provavelmente nunca ouviu falar [Windows] 2 editores de texto minimalistas Never Heard Of [Windows] Além de serem preferencialmente baseados em tempos de carregamento rápidos, alguns aplicativos simplesmente não exigem muitos recursos que consomem muitos recursos. Aplicações minimalistas são minúsculas e limpas, e desde que façam o trabalho, então você ... Leia mais (ou equivalentes para Mac Os melhores editores de texto Mac para usar em 2018 Os melhores editores de texto Mac para usar em 2018 Precisa de um novo texto editor para o seu Mac? Aqui estão os melhores editores de texto macOS gratuitos e pagos para texto simples, codificação e tudo mais.Leia mais, Linux Advanced Linux Editores de Texto Comparado: kate vs gedit Advanced Linux Editores de Texto Comparado: kate vs gedit usuário irá dizer-lhe que um bom editor de texto é um componente vital de um sistema de computador, não importa se você é um novo usuário ou um profissional experiente. Ao usar um texto Terminal ... Leia Mais, iOS Escrever App: A Beautiful iOS Editor de texto com suporte Markdown e dezenas de ações Escreva App: Um editor de texto iOS bonito com suporte Markdown & dezenas de ações Escrevendo aplicativos para o iPad e iPhone são abundantes. novas maneiras de editar texto usando recursos exclusivos em novas apps. Este ... Leia mais, e Android 7 editores de texto livre de distração para Android Comparado: Qual é o melhor? 7 editores de texto livre de distração para Android Comparado: Qual é o melhor? Faça um trabalho real no seu dispositivo Android usando um desses incríveis editores de texto. Consulte Mais informação ). Como quase todas as plataformas de computação vêm com um editor de texto básico, você pode colocar algumas informações (de texto) em um desses arquivos e ter certeza de que sempre poderá acessá-las. Outros aplicativos não precisam saber mais nada para pelo menos ler os dados corretamente.
No entanto, as coisas ficam mais complicadas quando você precisa representar algo como a fonte do texto ou uma data preenchida automaticamente na capa. Nestes casos, os caracteres ASCII contribuem para um formato baseado em texto, como Markdown What Is Markdown? 4 razões pelas quais você deve aprender agora O que é o Markdown? 4 razões pelas quais você deve aprender agora Cansado dos editores HTML e WYSIWYG? Em seguida, o Markdown é a resposta para você, não importa quem você é. Leia mais ou XML. Embora isso forneça os benefícios do texto simples, como transparência, esses arquivos geralmente exigem mais espaço para elementos como tags. Considere o seguinte arquivo de uma frase em texto simples e, em seguida, no formato “Flat ODT” (FODT) do Open Document Format, que usa XML. A imagem abaixo mostra que a versão de texto simples é de 53 bytes, enquanto a versão ODT é de 25.000 bytes .
Formatos Binários
Em contraste, os formatos binários O que é binário? [Tecnologia explicada] O que é binário? [Technology Explained] Dado que o binário é tão absolutamente fundamental para a existência de computadores, parece estranho que nós nunca tenhamos abordado o tópico antes - então hoje eu pensei em dar uma breve visão geral do que binário ... Read Mais são arquivos que um aplicativo irá construí-lo pouco a pouco. Você pode tentar abrir esses arquivos com um editor de texto, mas provavelmente não saberá como interpretá-los. A seguir, é mostrado o resultado da tentativa de abrir um arquivo do Microsoft Excel com um editor de texto.
O aplicativo precisa processar os dados em um arquivo binário de uma maneira específica. Ao abrir um arquivo XLS, um aplicativo deve tratar os primeiros dezesseis bytes do arquivo como o marcador “início de arquivo” (BOF). Dentro desse marcador, o quinto item é um único bit indicando se o arquivo foi ou não editado pela última vez na plataforma Windows (“fWin”). Ele vem depois de quatro outros itens, cada dois bytes, o que significa que o item “fWin” é o 65º bit no arquivo do Excel.
Como vimos, se você tentar abri-lo com um aplicativo que não manipule o 65º bit como o sinalizador "fWin", esse aplicativo não o abrirá corretamente. Ele pode exibir muitos caracteres ilegíveis na tela (mostrados acima), manipulá-lo normalmente com uma mensagem de erro (também mostrada acima, porque o Linux) ou travar. Em qualquer caso, ele não saberá como ler os dados corretamente e, portanto, não os exibirá corretamente. Mas os aplicativos, uma vez programados, podem manipular quantos formatos de arquivo forem desejados.
Formatos abertos vs. proprietários
A próxima consideração é se um formato de arquivo está aberto (isto é, disponível para fácil uso por outros) ou proprietário. Note que “proprietário” não é o mesmo que fechado, pelo menos não em todos os casos. Embora o debate “text vs. binary” acima tenha sido técnico, “open vs. proprietary” tem mais a ver com os termos de licenciamento de um formato de arquivo. Mais sobre isso nas seções a seguir.
Formatos Abertos
Formatos abertos são aqueles em que a licença permite que os usuários os adotem para seus próprios aplicativos. Um corpo de padrões de algum tipo também deve supervisionar seu desenvolvimento contínuo por uma comunidade de colaboradores para que os formatos sejam realmente “abertos”. Os formatos abertos também são livres de custos e restrições de licenciamento - eles podem ser usados por qualquer pessoa, para qualquer finalidade. Talvez o formato aberto mais famoso seja o Formato de Documento Aberto (ODF) 9 Formatos de Arquivo de Escritório Raro que Você Precisa Conhecer 9 Formatos de Arquivo de Escritório Raros que Você Precisa Conhecer Você já se deparou com formatos de arquivo estranhos em sua suíte de escritório? Nós lhe daremos uma breve introdução sobre tipos de arquivos de escritório raros, mas úteis, e para os quais você pode usá-los. Leia mais, lançado pela primeira vez em 2005 pela OASIS. Seu objetivo era oferecer uma alternativa ao bloqueio que a Microsoft tinha no mercado de produtividade.
Com formatos abertos, você nunca precisa temer que suas informações estejam bloqueadas em um determinado arquivo. Considere o seguinte, que mostra nosso arquivo de formato Flat ODT. Embora haja muitas informações estranhas ao redor, você pode ver os dados reais lá, como o dia.
Outro benefício de formatos abertos é sua documentação completa. É uma coisa para um arquivo ser facilmente legível. Um programador ainda vai (através de tentativa e erro) precisar descobrir o que exatamente cada recurso faz. Mas, no caso do ODF, a especificação da versão 1.2 fornece ao programador tudo o que ele precisa saber para implementar o suporte de forma eficiente.
Formatos Proprietários
Por fim, os formatos proprietários são protegidos por seus desenvolvedores. Isso pode acontecer porque eles incluem segredos comerciais, para fins de segurança (percebida) ou simplesmente porque o desenvolvedor não quer compartilhar seu trabalho. Seja qual for a razão, esses formatos são proprietários em virtude de Contratos de Licença de Usuário Final (EULAs) ou outros termos que proíbem o usuário de fazer engenharia reversa ou "quebrar" o formato de arquivo.
Uma vez apenas “proibido”, a Lei de Direitos Autorais do Milênio Digital O que é a Lei de Direitos Autorais de Mídia Digital? O que é a lei de direitos autorais de mídia digital? Leia mais (DCMA) mudou as coisas. Os desenvolvedores agora têm o apoio legal para perseguir aqueles que fazem engenharia reversa de seu trabalho. Você deve pensar no futuro antes de investir em um aplicativo que usa um formato proprietário. Você precisará migrar essas informações para outro lugar no futuro? Se sim, quão doloroso será? Será que a empresa estará em um ano ou cinco? Você deve considerar se os recursos de um aplicativo valem a pena se ele também significa estar bloqueado nesse desenvolvedor devido a formatos proprietários.
Exemplos de formatos de arquivo
Se você olhar o acima, algumas combinações vão saltar para você. É verdade que os formatos de arquivos baseados em texto se prestam a ser abertos . Da mesma forma, se o objetivo de um formato é ser proprietário, é mais fácil mantê-lo dessa forma, tornando-o binário. Mas isso nem sempre é o caso.
O formato de imagem XCF do GIMP é um formato aberto que também é binário. O projeto inclui uma descrição detalhada de como o formato contém os gráficos, texto e camadas que compõem um arquivo GIMP como bits brutos e bytes (mostrados abaixo). Os desenvolvedores podem usar isso para codificar sua própria implementação para que aplicativos externos como o ImageMagick Como facilmente recortar e redimensionar imagens no Linux Como facilmente recortar e redimensionar imagens no Linux Se você quiser fazer alguns recortes básicos e redimensionar no Linux - talvez para ajudar com um projeto ou tornar uma imagem mais fácil de carregar em suas redes sociais favoritas - então tente estes ... Leia Mais toolkit pode importá-los.
Por outro lado, o mais novo formato Microsoft Visio (VSDX) é um formato baseado em XML (e, portanto, baseado em texto). Publica uma referência detalhada da composição desses arquivos. No entanto, o documento de referência observa que a Microsoft “possui patentes que podem cobrir sua implementação” do suporte a .VSDX. Além disso, a Biblioteca do Congresso afirma que o uso da especificação VSDX “não garante a licença isenta de royalties de todas as patentes relevantes” se você usá-la. Essa é outra maneira de dizer que você pode jogar os dados e incluir esse suporte. Mas a Microsoft pode ou não querer que você pague mais tarde, dependendo de quão perto ela compete com o Visio.
Se você acha que eles são complicados, que tal o formato ODT não-plano. É um arquivo em formato ZIP (binário e aberto, a menos que você também esteja usando sua criptografia) que contém o texto de um documento ( content.xml, formato aberto baseado em texto) e gráficos (por exemplo, PNG, binário, mas aberto).
Quão importante são os formatos de arquivo, realmente?
Esta é uma pergunta difícil. Por um lado, alguns sistemas operacionais como o iOS tentam isolar os usuários de lidar com arquivos. Você tem o aplicativo que criou o arquivo para abri-lo, quem se importa com sua estrutura ou o que é extensão? No entanto, muitas organizações (especialmente governos) têm pressionado para garantir que os dados públicos estejam em formato aberto.
Se você é um idealista de software (não que haja algo de errado com isso), então, ao avaliar novos aplicativos, verifique se eles estão em um formato aberto (preferencialmente) baseado em texto. Se você quer apenas começar a trabalhar, os formatos proprietários podem não ser um problema para você.
O que você acha? Você exige que suas informações residam em formatos abertos baseados em texto que você pode converter e verificar? Ou são os formatos que os desenvolvedores usam, proprietários ou não, o suficiente para você? Deixe-nos saber abaixo nos comentários!
Créditos da Imagem: Edilus / Shutterstock