Insights de Domingo
Posts
😶 Google Gemini: Black Mirror mais próximo?

😶 Google Gemini: Black Mirror mais próximo?

Gere conteúdo rápido e de qualidade com Automação e IA

Eduardo Schurtz
10 de dezembro de 2023

Nessa edição:

IA
- Tudo o que você precisa saber sobre o Google Gemini
Sugestão da semana
- Uma IA incrível para pesquisa em tempo real
Automação da semana
- Como gerar conteúdo rápido e de qualidade com automação e inteligência artificial
Procura-se interessados em escalar seus negócios
Sugestão de LTD
- Caça automática de leads para seu negócio
Novidades das melhores ferramentas
- BeeHiiv

Boa leitura e uma excelente semana 🖖

Do nosso patrocinador

✨ Um ano novo, cheio de possibilidades infinitas e oportunidades empolgantes!

Chegou a hora de você escolher quem irá escalar com você no ano de 2024.

Ainda dá tempo de você fazer a migração do seu conteúdo para o Curseduca e utilizar a maior área de membros do mercado digital.

No Curseduca, entregamos uma série de recursos que te ajudam a:

✨ Vender mais para o seu cliente
🚀 Criar trilhas de aprendizado
👥 Ter uma comunidade avançada, semelhante a uma rede social
📊 Possuir uma ferramenta de Customer Success para garantir seu sucesso

Fale com um dos nossos especialistas e conheça a área de membros líder do mercado digital! 💙

🤖 IA

Tudo o que você precisa saber sobre o Google Gemini

O que é o Google Gemini?

O Google Gemini é um modelo de linguagem de inteligência artificial (IA) multimodal criado pelo Google, capaz de ensinar e responder problemas matemáticos complexos, gerar códigos de programação e realizar outras tarefas típicas de um chatbot com alta capacidade de raciocínio.

O que perguntar para o Gemini?

Você pode perguntar ao Gemini sobre problemas matemáticos, física, história, programação e outras áreas do conhecimento.

Ele também pode gerar textos e imagens combinadas, reconhecer visualmente objetos e diferenciar entre eles.

Como o Gemini se integra com serviços do Google?

O Gemini já está integrado ao Bard, o assistente de IA do Google. A expectativa é que a IA seja incorporada a outros serviços do Google nos próximos meses.

Além disso, o Gemini Pro estará disponível para desenvolvedores e clientes corporativos a partir de 13 de dezembro, por meio da Gemini API.

Qual a diferença entre Bard e Gemini?

O Bard é um assistente de IA do Google, enquanto o Gemini é um modelo de linguagem de IA que alimenta o Bard.

O Bard atual é alimentado por um modelo mais antigo, e o Gemini é o novo modelo que traz melhorias e capacidades multimodais.

De um modo simplista, é como se o Bard fosse o ChatGPT e o Gemini, o GPT-4.

Quais as versões disponíveis do Gemini?

O Google Gemini está disponível em três versões: Gemini Nano, Gemini Pro e Gemini Ultra:

Gemini Nano: Esta é uma versão otimizada para dispositivos móveis, capaz de executar tarefas diretamente em dispositivos, mesmo offline. O Gemini Nano é como uma versão compacta do Gemini padrão, preparada para rodar nativamente em celulares, como o Pixel 8 Pro. Ele contém capacidades para usos gerais, como resumo de textos, respostas contextualizadas, correção gramatical e revisão avançada.
Gemini Pro: Esta versão é projetada para escalonar em vários tipos de tarefas com computação em nuvem. O Gemini Pro está disponível dentro do Bard e é capaz de realizar diversas tarefas. Ele também estará disponível para desenvolvedores e clientes corporativos a partir de 13 de dezembro, por meio da Gemini API.
Gemini Ultra: Esta é a versão mais poderosa do Gemini, voltada para tarefas de alta complexidade. A disponibilidade do Gemini Ultra está prevista apenas para 2024.

Como o Gemini se compara ao GPT-4 da OpenAI?

O Google Gemini e o GPT-4 da OpenAI são dois modelos de linguagem de inteligência artificial (IA) altamente avançados. Ambos são capazes de realizar tarefas complexas, mas existem algumas diferenças significativas entre eles.

O Gemini é um sistema de IA multimodal, o que significa que ele pode produzir saídas em formatos de imagem, vídeo e áudio.

Ele é treinado com chips TPUv5 do Google, que permitem um processamento mais rápido. Isso faz com que o Gemini seja capaz de lidar com tarefas complexas com relativa facilidade.

Além disso, o Gemini é dito como sendo constantemente aprendendo e melhorando, sendo capaz de incorporar novas informações em tempo real.

Em comparação, o GPT-4 é um modelo de linguagem grande e multimodal da OpenAI. Ele foi pioneiro no espaço de IA generativa com o ChatGPT. No entanto, em termos de desempenho, o Gemini “superou” o GPT-4 em vários benchmarks. De acordo com os testes de benchmark do Google, o Gemini derrotou o GPT-4 em 30 de 32 benchmarks.

Várias críticas foram feitas na forma como o Google realizou esses testes de benchmark. Alguns usuários apontaram que o Google pode ter usado uma versão desatualizada do GPT-4 para os benchmarks, o que tornaria as comparações redundantes. Além disso, os prompts dados a ambos os modelos não eram idênticos, o que poderia ter implicações significativas para os resultados.

Nunca confie cegamente em benchmarks 😉

Em resumo, embora o Gemini e o GPT-4 sejam ambos modelos de IA altamente avançados, o Gemini parece ter uma vantagem em termos de desempenho e capacidade de processamento. No entanto, as críticas sobre a metodologia de teste do Google sugerem que mais pesquisas e comparações independentes podem ser necessárias para determinar definitivamente qual modelo é superior.

O Google enganou todo mundo com o vídeo de demonstração?

O vídeo de demonstração mostra conversas faladas entre o usuário e um chatbot alimentado pelo Gemini, além de demonstrar a capacidade do Gemini de reconhecer imagens e objetos físicos.

No entanto, o Google confirmou que o vídeo era uma representação ilustrativa das possibilidades de interação com o Gemini, baseada em prompts e saídas multimodais reais de testes 🫠

Como utilizar o Gemini no Brasil?

Para utilizar o Gemini no Brasil, é necessário acessar o Bard (bard.google.com) e alterar o idioma da sua conta Google para inglês.

Depois de alterar o idioma, você pode navegar no Bard e usar o Gemini.

O que esperar do Google Gemini?

Ainda é cedo para dizer como vai ser. Como vimos acima, não dá pra confiar em benchmarks e apresentações, precisamos testar na prática.

Mas algo é fato: uma vantagem absurda do Google é a integração com todo seu ecossistema.

Imagine uma IA com acesso a:

Seus emails do Gmail
Seus vídeos do Youtube
Suas fotos do Google Fotos
Seus compromissos do Google Agenda
Suas planilhas do Google Sheets
Seus documentos do Google Docs
Suas apresentações do Google Slides
Suas notas do Google Keep
Suas reuniões do Google Meet
Seus histórico de buscas no Google
Tudo o que você tem armazenado no Google Drive

Chega a assustar, não é mesmo?

Mas imagine o quão assertiva e útil será uma IA com todas essas informações sobre você e seus negócios.

No projeto NotebookLM do Google utilizando o Gemini Pro, já dá para imaginar como vai ser útil, mas ainda precisamos enviar alguns arquivos manualmente.

Imagine que você tenha 100% dos seus documentos no Google Drive e a integração esteja finalizada.

Vai bastar perguntar ao Google.

Ouvir falar do ‘Projeto Ellmann‘?

Visa absorver resultados de pesquisas e identificar padrões em fotos, culminando na criação de um chatbot capaz de responder a perguntas complexas sobre a vida do usuário.

O projeto sugere que grandes modelos de linguagem (LLMs, na sigla em inglês) podem inferir momentos significativos na vida de um usuário, como o nascimento de um filho, baseando-se em informações contextuais variadas. A tecnologia poderia utilizar diferentes níveis de contexto para melhor compreender e narrar a história da vida do usuário.

A equipe do Google também demonstrou o “Chat Ellmann”, uma funcionalidade que permitiria aos usuários fazer perguntas sobre suas vidas, com respostas personalizadas baseadas no conhecimento adquirido pelo LLM sobre as suas vidas.

Lembrou de algo?

S1.E3 | Black Mirror

E mais

🤖 Anthropic’s latest tactic to stop racist AI: Asking it ‘really really really really’ nicely

🤖 Long context prompting for Claude 2.1

🤖 A inteligência artificial dança por você: nova ferramenta consegue dar movimento para fotos

🤖 Meta lança IA que cria imagens estilo DALL-E e Midjourney

🤖 O novo passo da gigante: Amazon vai rumo à inteligência artificial

🤖 IA generativa: Copilot para Windows 11 será atualizado com GPT-4 Turbo e DALL-E 3, anuncia Microsoft

🤖 Uma simples imagem por IA gasta mais energia que um celular

👌 Sugestão da semana

Atualmente temos vários modelos de IA disponíveis, de diversas empresas: OpenAI, Google, Anthropic, Meta, xAI, entre outros.

Mas existe uma que se destaca para conteúdo em tempo real: Perplexity.

Estou utilizando bastante, principalmente para buscar informações atualizadas.

Ela é ótima para trabalhar com links e o recurso Copilot é fantástico, como se fosse um assistente pessoal.

Sem contar que ela é muito rápida.

Vale criar sua conta e conferir o que ela pode fazer.

🦾 Vamos falar de Automação?

Tinha uma coisa me incomodando há muito tempo...

Como poderia gerar mais valor para os meus mentorados?

Como compartilhar com eles as minhas descobertas mais recentes, minhas ideias mais doidas, meus insights, testes que fiz recentemente... sem ter que sempre depender dos encontros quinzenais ou gravação de vídeos?

Criar um conteúdo de qualidade não é simples, leva tempo.

Simplesmente encher o grupo de áudios, não é eficiente.

Apenas escrever algumas mensagens rápidas, também não.

Alguns conteúdos exigem uma explicação mais detalhada, pela complexidade.

E essa dificuldade de criar esse material, acabava me travando.

🤔 Comecei a refletir: como acelerar o input (entrada de informações) e o output (geração do conteúdo final) com automação e inteligência artificial?

Primeiro eu precisava de um jeito rápido para coletar o que estava na minha mente... digitar tudo estava fora de cogitação. Além de digitar, tem que corrigir o texto, formatar, estruturar, etc.

Qual método é bem mais rápido? Áudio.

E como deixar o processo de envio de áudio ainda mais rápido? Áudio pelo Whatsapp.

Só isso já facilitaria muito, era só gravar um áudio e sair falando, depois transcrever automaticamente.

Mas eu queria mais...

Não queria ter que enviar tudo em um único áudio. Às vezes vamos lembrando aos poucos e temos ideias incríveis durante o dia.

Não queria também depender apenas dos áudios, queria poder complementar com trechos de textos que peguei de uma conversa, de um email, de um site, de um documento... de qualquer lugar.

Fui além...

Se eu quisesse enriquecer esse material com links de artigos, de qualquer idioma? Onde um breve resumo em português desse artigo já faria parte do conteúdo, o link nem precisaria ser aberto, estaria ali apenas como referência...

E imagens para melhorar o entendimento? Facilitar a compreensão?

Vídeos? Claro! (também já resumido com os tópicos mais importantes).

OK... tudo muito legal, mas como "empacotar" isso tudo e transformar em um conteúdo?

🧙🏻‍♂️ Aí que vem a mágica, vou explicar abaixo na automação da semana…

Automação da Semana

Antes de começarmos, um aviso: essa automação começou a ganhar vida essa semana, ainda não está finalizada.

Acredito que a ideia em si já pode ajudar muitas pessoas.

Bom, vamos lá.

Como gerar conteúdo rápido e de qualidade com automação e inteligência artificial

Todos esses materiais são enviados pelo Whatsapp para o número da Vic (minha assistente virtual) via Z-API, onde a automação no Make vai processar esses materiais (transcrever, traduzir, reconhecer, etc) e no final mandar para a IA formatar o conteúdo.

Por exemplo, digamos que eu envie 7 áudios falando de um assunto, obviamente terá muita coisa desnecessária: pausas longas na fala, erros, redundância, interrupções...

Isso tudo será removido, apenas informações relevantes estarão presentes no conteúdo final.

Em alguns minutos eu teria pronto um conteúdo lapidado e, muito importante, criado por mim, não 100% por alguma IA aleatória.

Quanto tempo levaria para preparar esse material, pelo jeito "tradicional"?

(já se deu conta da infinidade de outros usos para essa automação? Geração de artigos de blogs, emails, eBooks...) 🤑

Com o conteúdo pronto, como compartilhar com os mentorados?

Para facilitar e agilizar o processo, optei pelo Notion. Uma base de dados organizada por temas, tags, categorias e datas, torna o uso bem simples.

Todo conteúdo enviado pelo Whatsapp, é armazenado em uma banco de dados do Notion:

Banco de dados de conteúdos no Notion

Quando finalizar o envio de informações, o conteúdo finalizado será armazenado em outro banco de dados (também no Notion), que será compartilhado com os mentorados:

Conteúdo automático no Notion

No exemplo acima, eu estava comparando os resultados com GPT-4, Perplexity e Claude 2.1. Futuramente quero o Grok para trazer conteúdos do X (Twitter) também.

Nessa fase ainda está apenas com texto, em breve quero implementar com o complemento de imagens, vídeos e links que mencionei acima.

A automação atualmente está assim:

Automação no Make para coleta de dados e geração de conteúdo

Começa com um Webhook configurado no Z-API para receber as mensagens enviadas.

Depois utilizo um data store (muito útil no Make) para armazenar e controlar em que momento está o processo, pois preciso identificar:

Quando iniciar a coleta de informações para um assunto X. Aqui no caso, eu inicio com uma palavra-chave.
Para cada mensagem enviada, saber se a coleta está ativa ou não.
Quando encerrar a coleta de informações para o tema.

Para cada mensagem recebida, eu verifico o tipo: por enquanto apenas texto ou áudio.

Se for texto, apenas insere no Notion.

Se for áudio, converte para MP3 com o CloudConvert e envia para o Whisper transcrever. Depois insere no Notion.

Falta implementar:

Imagens, quero usar o GPT-4V para identificar o conteúdo e enviar um resumo junto.
Links, usarei o Perplexity, ele é excelente para acessar conteúdo em tempo real (falo dele na Sugestão da Semana dessa edição).
Vídeos, posso usar o Perplexity também para vídeos online.

Resumindo, é isso.

Espero que essa automação abra sua cabeça para várias possibilidades 🤯

Quem é mentorado vai acompanhar tudo de perto, receber acesso ao Notion e às automações quando estiverem finalizadas.

🔍 Procura-se interessados em escalar seus negócios

Chega a ser assustador curioso ver alguns negócios médios e grandes que ainda não utilizam ou utilizam muito pouco as automações digitais, seja para eliminar trabalhos manuais e repetitivos, seja para escalar e aumentar faturamento.

Inteligência Artificial então, nem se fala…

Mas é compreensível, mesmo com tanta informação disponível hoje, difícil encontrar pessoas qualificadas que consigam analisar um negócio e implementar essas soluções, de maneira personalizada.

É preciso ter criatividade, saber e gostar de resolver problemas, entender de negócios, processos e ter muito conhecimento em ferramentas e integrações.

Justamente por isso que pessoas e empresas estão me procurando cada vez mais.

Chegam até mim pelo meu conteúdo, indicação ou pesquisa.

Além de gostar muito de resolver problemas, tenho extrema facilidade em analisar processos e mapear tudo o que pode ser melhorado com tecnologia.

Algum dos meus programas (mentoria, consultoria) pode ajudar nesse processo.

Se você tem um negócio e busca escala, entre em contato e vamos conversar (ou responda esse email).

💸 LTD (lifetime deal) da semana

Procurando uma ferramenta para encontrar leads para seu negócio?

O FindThatLead é uma ferramenta de geração de leads B2B que permite aos usuários encontrar e verificar endereços de email de potenciais clientes.

A ferramenta é projetada para ajudar as empresas a adquirir novos clientes, enviando campanhas de email frio para uma lista de prospectos qualificados gerada pelo Prospector.

A ferramenta oferece várias funcionalidades, incluindo a capacidade de enriquecer seu banco de dados e melhorar seus anúncios pagos com listas baseadas em localização, indústria, tamanho da empresa e palavras-chave.

Além disso, possui uma extensão do Chrome que permite encontrar leads em qualquer site, Twitter ou LinkedIn de maneira mais rápida.

A ferramenta também possui um recurso de Drip que permite o acompanhamento automático de qualquer email para obter a melhor taxa de resposta.

Conta com um painel avançado que permite aos usuários conhecer o status de sua campanha, analisar os resultados de seus emails e melhorar suas taxas de abertura e resposta.

Eu comprei o LTD dessa ferramenta há muito tempo, ela está de volta ao Appsumo, mas encerra em poucos dias.

É similar às ferramentas Hunter.io, Lemlist e Lusha.

De qualquer forma, você tem 60 dias para testar e, caso desista, pode pedir reembolso.

PS. Confira aqui a minha lista de LTDs disponíveis para venda (interessados, chamar no Instagram)

💎 Que tal receber mais dessas sugestões de LTDs semanalmente, direto no Whatsapp? Já é possível com o Filtro Digital, minha curadoria de ferramentas e LTDs.

LTD quer dizer Lifetime Deal, ou seja, pague uma única vez e utilize para sempre. Empresas fazem essas ofertas temporárias geralmente para levantar capital ou escalar seus negócios. Depois que a oferta encerra, só é possível assinar o serviço normalmente pagando todos os meses.

🛠 Ferramentas: Novidades

🛠️ BeeHiiv com mais novidades. Além de melhorias no dashboard do Boosts e Ads (que infelizmente ainda não funcionam no Brasil), Table of contents, Anchor links e melhorias nas automações.

🧠 O que tá rolando por aqui

🍿 Assisti hoje a esse vídeo do Fireship falando sobre 10 tendências de tecnologia para 2024, com aquela pegada irônica clássica.

🤔 Nesse tweet um usuário mostra uma conversa com o Grok onde ele dá uma resposta como se estivesse utilizando a API da OpenAI.

🐝 by Beehiiv (Crie sua conta por esse link e use o cupom ES20 para ganhar 20% OFF nos 3 primeiros meses).

👋 Considerações Finais

💎 Já pensou ter uma curadoria de ferramentas e LTDs e receber uma seleção das melhores direto no Whatsapp, toda semana? Já é possível no Filtro Digital.

🔑 Inscreva-se no Chave Mestra para ter conteúdo exclusivo e avançado sobre Automação, I.A., Marketing Digital e Ferramentas. Temos área de membros com videoaulas e grupo no Whatsapp para tirar dúvidas e trocar experiências.

Reply

or to participate.