
Usando o Amazon Textract como OCR para Extração de Dados no DynamoDB
Aprenda ainda mais sobre o Amazon Textract e extraia facilmente textos de praticamente qualquer documento. Para isso, nosso super expert apresenta novas formas de interagir com essa ferramenta.
O que você vai desenvolver </>
Descrição: Neste projeto prático hands-on, o objetivo é apresentar aos participantes novas formas de interagir com o Amazon Textract, uma ferramenta de reconhecimento óptico de caracteres (OCR), e utilizá-la para extrair facilmente textos de praticamente qualquer documento. O foco principal será a integração do Amazon Textract com o serviço de banco de dados DynamoDB da AWS.
Objetivo: O objetivo deste projeto é permitir aos participantes aprofundar seus conhecimentos sobre a tecnologia Amazon Textract, além de aprender a extrair dados de documentos de forma rápida e eficiente utilizando essa ferramenta. Ao final do projeto, espera-se que os participantes sejam capazes de implementar a integração entre o Amazon Textract e o DynamoDB, armazenando os resultados extraídos em um banco de dados distribuído e altamente escalável.
Requisitos técnicos:
- Conhecimento básico de AWS e serviços como S3, Lambda e DynamoDB
- Acesso a uma conta AWS com permissões de administrador
- Computador com acesso à internet
- Ambiente de desenvolvimento AWS CLI instalado
- Familiaridade com a linguagem de programação preferencial para o projeto (Python, Java, .NET, etc.)
- Documentos de teste para realizar a extração dos dados (imagens, PDFs, etc.)
- Disponibilidade de aproximadamente 2 horas para concluir o projeto, excluindo o tempo necessário para configuração inicial.
Tecnologia utilizada:
- AWS (Amazon Web Services): ambiente de nuvem para hospedagem dos serviços utilizados no projeto.
- Amazon Textract: serviço de reconhecimento óptico de caracteres (OCR) que permite extrair textos de documentos.
- DynamoDB: serviço de banco de dados NoSQL altamente escalável oferecido pela AWS.
- AWS Lambda: serviço de computação sem servidor que permite executar código sem provisionar nem gerenciar servidores.
- AWS CLI: interface de linha de comando da AWS para interagir com os serviços da AWS.
Observações:
Este projeto tem como objetivo ser um hands-on prático, portanto, os participantes terão a oportunidade de implementar a integração do Amazon Textract com o DynamoDB por meio de exercícios práticos e tutoriais passo a passo. Será necessário que cada participante tenha acesso a uma conta AWS para realizar as configurações e testes necessários.
Quem vai te guiar neste projeto </>
Sobre a DIO
ACADEMIA PME EDUCACAO E CONSULTORIA EM NEGOCIOS LTDA.
CNPJ: 26.965.884/0001-02
A DIO é a maior comunidade de aprendizado contínuo em tecnologia da América Latina, que conecta os melhores talentos com as empresas mais inovadoras do mundo.
Um ecossistema educacional completo para aprendizagem em desenvolvimento de software, engenharia de dados, qualidade de software e computação em nuvem.