O que é IA?

A inteligência artificial, ou IA, é uma tecnologia que permite que computadores e máquinas simulem a inteligência humana e as capacidades de resolução de problemas.
Por si só ou combinada com outras tecnologias (por exemplo, sensores, geolocalização, robótica), a IA pode realizar tarefas que de outra forma exigiriam inteligência ou intervenção humana. Assistentes digitais, orientação por GPS, veículos autônomos e ferramentas generativas de IA (como o Chat GPT da Open AI) são apenas alguns exemplos de IA nas notícias diárias e em nossa vida diária.
Como um campo da ciência da computação, a inteligência artificial abrange (e é frequentemente mencionada junto com) aprendizado de máquina e aprendizado profundo. Estas disciplinas envolvem o desenvolvimento de algoritmos de IA, modelados a partir dos processos de tomada de decisão do cérebro humano, que podem “aprender” com os dados disponíveis e fazer classificações ou previsões cada vez mais precisas ao longo do tempo.
A inteligência artificial passou por muitos ciclos de entusiasmo, mas mesmo para os céticos, o lançamento do ChatGPT parece marcar um ponto de viragem. A última vez que a IA generativa teve tamanho impacto, os avanços foram na visão computacional, mas agora o salto em frente está no processamento de linguagem natural (PNL). Hoje, a IA generativa pode aprender e sintetizar não apenas a linguagem humana, mas também outros tipos de dados, incluindo imagens, vídeos, códigos de software e até estruturas moleculares.
As aplicações para IA crescem a cada dia. Mas à medida que aumenta o entusiasmo em torno do uso de ferramentas de IA nos negócios, as conversas sobre ética da IA e IA responsável tornam-se extremamente importantes. Para saber mais sobre a posição da IBM em relação a essas questões, leia Construindo confiança na IA.
Tipos de inteligência artificial: IA fraca vs. IA forte
A IA fraca, também conhecida como IA estreita ou inteligência artificial estreita (ANI), é uma IA treinada e focada para executar tarefas específicas. A IA fraca impulsiona a maior parte da IA que nos rodeia hoje. “Estreito” pode ser um descritor mais adequado para este tipo de IA, pois é tudo menos fraco: permite alguns aplicativos muito robustos, como Siri da Apple, Alexa da Amazon, IBM watsonx™ e veículos autônomos.
A IA forte é composta de inteligência artificial geral (AGI) e superinteligência artificial (ASI). AGI, ou IA geral, é uma forma teórica de IA em que uma máquina teria uma inteligência igual à dos humanos; seria autoconsciente e com uma consciência que teria a capacidade de resolver problemas, aprender e planejar o futuro. ASI – também conhecida como superinteligência – superaria a inteligência e a capacidade do cérebro humano. Embora a IA forte ainda seja inteiramente teórica, sem exemplos práticos em uso hoje, isso não significa que os pesquisadores de IA não estejam também explorando o seu desenvolvimento. Enquanto isso, os melhores exemplos de ASI podem vir da ficção científica, como HAL, o assistente de computador sobre-humano e desonesto em 2001: Uma Odisseia no Espaço.
Aprendizado profundo versus aprendizado de máquina
O aprendizado de máquina e o aprendizado profundo são subdisciplinas da IA, e o aprendizado profundo é uma subdisciplina do aprendizado de máquina.
Os algoritmos de aprendizado de máquina e de aprendizado profundo usam redes neurais para “aprender” com grandes quantidades de dados. Essas redes neurais são estruturas programáticas modeladas a partir dos processos de tomada de decisão do cérebro humano. Eles consistem em camadas de nós interconectados que extraem características dos dados e fazem previsões sobre o que os dados representam.
O aprendizado de máquina e o aprendizado profundo diferem nos tipos de redes neurais que usam e na quantidade de intervenção humana envolvida. Os algoritmos clássicos de aprendizado de máquina usam redes neurais com uma camada de entrada, uma ou duas camadas “ocultas” e uma camada de saída. Normalmente, esses algoritmos são limitados ao aprendizado supervisionado: os dados precisam ser estruturados ou rotulados por especialistas humanos para permitir que o algoritmo extraia recursos dos dados.
Os algoritmos de aprendizagem profunda usam redes neurais profundas – redes compostas por uma camada de entrada, três ou mais (mas geralmente centenas) de camadas ocultas e um layout de saída. Essas múltiplas camadas permitem o aprendizado não supervisionado: elas automatizam a extração de recursos de conjuntos de dados grandes, não rotulados e não estruturados. Como não requer intervenção humana, o aprendizado profundo permite essencialmente o aprendizado de máquina em grande escala.
A ascensão dos modelos generativos
A IA generativa refere-se a modelos de aprendizagem profunda que podem pegar dados brutos – digamos, toda a Wikipédia ou as obras coletadas de Rembrandt – e “aprender” a gerar resultados estatisticamente prováveis quando solicitado. Em alto nível, os modelos generativos codificam uma representação simplificada de seus dados de treinamento e extraem deles para criar um novo trabalho que é semelhante, mas não idêntico, aos dados originais.

Modelos generativos têm sido usados há anos em estatística para analisar dados numéricos. A ascensão da aprendizagem profunda, no entanto, tornou possível estendê-la a imagens, fala e outros tipos de dados complexos. Entre a primeira classe de modelos de IA a alcançar esse feito cruzado estavam os autoencoders variacionais, ou VAEs, introduzidos em 2013. Os VAEs foram os primeiros modelos de aprendizagem profunda a serem amplamente utilizados para gerar i realistas.

magos e fala.
“Os VAEs abriram as comportas para a modelagem generativa profunda, tornando os modelos mais fáceis de escalar”, disse Akash Srivastava, especialista em IA generativa do MIT-IBM Watson AI Lab. “Muito do que hoje consideramos IA generativa começou aqui.”
Os primeiros exemplos de modelos, incluindo GPT-3, BERT ou DALL-E 2, mostraram o que é possível. No futuro, os modelos serão treinados em um amplo conjunto de dados não rotulados que podem ser usados para diferentes tarefas, com ajuste mínimo. Os sistemas que executam tarefas específicas em um único domínio estão dando lugar a sistemas amplos de IA que aprendem de forma mais geral e trabalham em vários domínios e problemas. Os modelos básicos, treinados em grandes conjuntos de dados não rotulados e ajustados para uma variedade de aplicações, estão impulsionando essa mudança.
Quanto ao futuro da IA, quando se trata de IA generativa, prevê-se que os modelos básicos acelerarão drasticamente a adoção da IA nas empresas. A redução dos requisitos de rotulagem tornará muito mais fácil para as empresas mergulharem, e a automação altamente precisa e eficiente orientada pela IA que permitem significará que muito mais empresas serão capazes de implementar a IA numa gama mais ampla de situações de missão crítica. Para a IBM, a esperança é que o poder computacional dos modelos básicos possa eventualmente ser levado a todas as empresas em um ambiente de nuvem híbrida sem atritos.
Explore modelos de fundação em watsonx.ai
Aplicações de inteligência artificial
Existem inúmeras aplicações no mundo real para sistemas de IA hoje. Abaixo estão alguns dos casos de uso mais comuns:
Reconhecimento de fala
Também conhecido como reconhecimento automático de fala (ASR), reconhecimento de fala por computador ou fala para texto, o reconhecimento de fala usa PNL para processar a fala humana em um formato escrito. Muitos dispositivos móveis incorporam reconhecimento de fala em seus sistemas para realizar pesquisas por voz (Siri, por exemplo) ou fornecem mais acessibilidade para mensagens de texto em inglês ou em muitos idiomas amplamente utilizados. Veja como Don Johnston usou o IBM Watson Text to Speech para melhorar a acessibilidade na sala de aula com nosso estudo de caso.
Atendimento ao Cliente
  Agentes virtuais e chatbots on-line estão substituindo os agentes humanos ao longo da jornada do cliente. Eles respondem a perguntas frequentes (FAQ) sobre tópicos como frete, ou fornecem aconselhamento personalizado, venda cruzada de produtos ou sugestões de tamanhos para usuários, mudando a maneira como pensamos sobre o envolvimento do cliente em sites e plataformas de mídia social. Os exemplos incluem bots de mensagens em sites de comércio eletrônico com agentes virtuais, aplicativos de mensagens, como Slack e Facebook Messenger, e tarefas geralmente realizadas por assistentes virtuais e assistentes de voz. Veja como a Autodesk Inc. usou o IBM watsonx Assistant para acelerar o tempo de resposta do cliente em 99% com nosso estudo de caso.
Visão computacional
Esta tecnologia de IA permite que computadores e sistemas obtenham informações significativas a partir de imagens digitais, vídeos e outros dados visuais e, com base nesses dados, possam agir. Esta capacidade de fornecer recomendações o distingue das tarefas de reconhecimento de imagens. Alimentada por redes neurais convolucionais, a visão computacional tem aplicações em marcação de fotos em mídias sociais, imagens radiológicas na área da saúde e carros autônomos na indústria automotiva. Veja como o ProMare usou o IBM Maximo para definir um novo rumo para a pesquisa oceânica com nosso estudo de caso.
Cadeia de mantimentos
A robótica adaptativa atua nas informações dos dispositivos da Internet das Coisas (IoT) e nos dados estruturados e não estruturados para tomar decisões autônomas. As ferramentas de PNL podem compreender a fala humana e reagir ao que lhes é dito. A análise preditiva é aplicada à capacidade de resposta à demanda, otimização de estoque e rede, manutenção preventiva e fabricação digital. Algoritmos de pesquisa e reconhecimento de padrões – que não são mais apenas preditivos, mas hierárquicos – analisam dados em tempo real, ajudando as cadeias de suprimentos a reagir à inteligência aumentada gerada por máquina, ao mesmo tempo que fornecem visibilidade e transparência instantâneas. Veja como Hendrickson usou o IBM Sterling para alimentar transações em tempo real com nosso estudo de caso.
Previsão do tempo
Os modelos meteorológicos em que as emissoras se baseiam para fazer previsões precisas consistem em algoritmos complexos executados em supercomputadores. As técnicas de aprendizado de máquina aprimoram esses modelos, tornando-os mais aplicáveis e precisos. Veja como a Emnotion usou o IBM Cloud para capacitar empresas sensíveis às condições climáticas a tomarem decisões mais proativas e baseadas em dados com nosso estudo de caso.
Detecção de anomalia
Os modelos de IA podem vasculhar grandes quantidades de dados e descobrir pontos de dados atípicos em um conjunto de dados. Essas anomalias podem aumentar a conscientização sobre equipamentos defeituosos, erros humanos ou violações de segurança. Veja como a Netox usou o IBM QRadar para proteger negócios digitais contra ameaças cibernéticas com nosso estudo de caso.
História da inteligência artificial: principais datas e nomes

A ideia de “uma máquina que pensa” remonta à Grécia antiga. Mas desde o advento da computação eletrônica (e em relação a alguns dos tópicos discutidos neste artigo) eventos e marcos importantes na evolução da inteligência artificial eu

nclui o seguinte:
1950: Alan Turing publica Computing Machinery and Intelligence (link externo a ibm.com). Neste artigo, Turing – famoso por decifrar o código ENIGMA alemão durante a Segunda Guerra Mundial e muitas vezes referido como o “pai da ciência da computação” – faz a seguinte pergunta: “As máquinas podem pensar?” A partir daí, ele oferece um teste, agora conhecido como “Teste de Turing”, onde um interrogador humano tentaria distinguir entre uma resposta de computador e uma resposta de texto humana. Embora este teste tenha sido submetido a muito escrutínio desde que foi publicado, continua a ser uma parte importante da história da IA, bem como um conceito contínuo dentro da filosofia, uma vez que utiliza ideias em torno da linguística.
1956: John McCarthy cunha o termo “inteligência artificial” na primeira conferência de IA no Dartmouth College. (McCarthy inventaria a linguagem Lisp.) Mais tarde naquele ano, Allen Newell, J.C. Shaw e Herbert Simon criaram o Logic Theorist, o primeiro programa de software de IA em execução.
1967: Frank Rosenblatt constrói o Mark 1 Perceptron, o primeiro computador baseado em uma rede neural que “aprendeu” por tentativa e erro. Apenas um ano depois, Marvin Minsky e Seymour Papert publicam um livro intitulado Perceptrons, que se torna ao mesmo tempo um marco no trabalho sobre redes neurais e, pelo menos por um tempo, um argumento contra futuros projetos de pesquisa em redes neurais.
Década de 1980: Redes neurais que usam um algoritmo de retropropagação para treinar a si mesmas tornam-se amplamente utilizadas em aplicações de IA.
1995: Stuart Russell e Peter Norvig publicam Inteligência Artificial: Uma Abordagem Moderna (link externo à ibm.com), que se torna um dos principais livros didáticos no estudo da IA. Nele, eles se aprofundam em quatro objetivos ou definições potenciais de IA, que diferenciam os sistemas de computador com base na racionalidade e no pensamento versus a ação.
1997: Deep Blue da IBM vence o então campeão mundial de xadrez Garry Kasparov, em uma partida de xadrez (e revanche).
2004: John McCarthy escreve um artigo, O que é inteligência artificial? (link externo a ibm.com) e propõe uma definição de IA frequentemente citada.
2011: IBM Watson vence os campeões Ken Jennings e Brad Rutter no Jeopardy!
2015: O supercomputador Minwa do Baidu usa um tipo especial de rede neural profunda chamada rede neural convolucional para identificar e categorizar imagens com uma taxa de precisão mais alta do que a média humana.
2016: O programa AlphaGo da DeepMind, alimentado por uma rede neural profunda, vence Lee Sodol, o jogador campeão mundial de Go, em uma partida de cinco jogos. A vitória é significativa dado o enorme número de movimentos possíveis à medida que o jogo avança (mais de 14,5 biliões após apenas quatro movimentos!). Mais tarde, o Google comprou a DeepMind por US$ 400 milhões.
2023: Um aumento em grandes modelos de linguagem, ou LLMs, como ChatGPT, cria um
enorme mudança no desempenho da IA e no seu potencial para gerar valor empresarial. Com essas novas práticas generativas de IA, os modelos de aprendizagem profunda podem ser pré-treinados em grandes quantidades de dados brutos e não rotulados.
Soluções relacionadas
Soluções de Inteligência Artificial (IA)
Coloque a IA para trabalhar em seus negócios com a experiência em IA líder do setor e o portfólio de soluções da IBM ao seu lado.
Explore soluções de IA
Serviços de IA
Reinvente fluxos de trabalho e operações críticas adicionando IA para maximizar experiências, tomada de decisões em tempo real e valor comercial.
Explore os serviços de IA
IA para segurança cibernética
A IA está mudando o jogo da segurança cibernética, analisando enormes quantidades de dados de risco para acelerar os tempos de resposta e aumentar as operações de segurança com poucos recursos.
Explore a IA para segurança cibernética
Recursos
EbookComo escolher o modelo certo de base de IA
Aprenda como usar a estrutura de seleção de modelo para selecionar o modelo básico para suas necessidades de negócios.
TreinamentoEconomize até 70% com nossa assinatura de aprendizagem digital
Acesse nosso catálogo completo de mais de 100 cursos on-line adquirindo hoje mesmo uma assinatura de aprendizagem digital individual ou multiusuário, permitindo que você expanda suas habilidades em uma variedade de nossos produtos por um preço baixo.
Pesquisa de mercado2023 Gartner Peer Insights Escolha dos Clientes
IBM watsonx Assistant reconhecido como a escolha dos clientes no relatório Voz do Cliente do Gartner Peer Insights de 2023 para plataformas de IA conversacional empresarial
Estratégia de compras aprimorada por ArticleAI
Descubra como o machine learning pode prever a demanda e reduzir custos.