ChatGPT — Descrevendo Imagens
Olá Gente
A API do ChatGPT possui muitos recursos interessantes, um deles, é enviar uma imagem e pedir para descrever o que tem na imagem, ou mesmo, fazer perguntas sobre a imagem.
Para este exemplo, iremos enviar a imagem abaixo e perguntar “Descreva a imagem”:
Para interagirmos com a API, iremos utilizar o endpoint “chat/completions”:
https://api.openai.com/v1/chat/completions
Neste endpoint, temos que enviar um POST com um Json com alguns parâmetros:
- model: O modelo que será utilizado, neste caso, iremos utilizar “gpt-4o”
- messages: Neste campo iremos enviar nossa pergunta e a imagem
No elemento “messages” temos que enviar
- Nossa pergunta
- A imagem
E no cabeçalho, precisamos enviar:
- Authorization: Bearer [SeuApiKey]
Segue exemplo do Post:
{
"model": "gpt-4o",
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "Descreva a imagem"
},
{
"type": "image_url",
"image_url": {
"url": "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg"
}
}
]
}
],
"max_tokens": 300
}
A resposta da API será um Json onde a resposta da pergunta esta em “choices[0].message.content”:
Para este exemplo, recebemos como descrição da imagem:
A imagem mostra um cenário natural tranquilo sob um céu parcialmente nublado. Ao centro, há uma passarela de madeira que se estende através de um campo de grama alta e verdejante. A vegetação é densa e parece intocada, com arbustos e pequenas árvores ao fundo, formando uma linha que se mistura com o horizonte aberto. A luz solar, aparentemente de final de tarde ou início de manhã, ilumina a cena com uma suavidade que enfatiza a serenidade do local. A passarela convida quem observa a imagem a caminhar por ela e explorar a natureza ao redor. É uma cena que evoca paz e uma conexão com o ambiente natural.
💡
ATENÇÃO:
O modelo "gpt-4-vision-preview" foi descontinuado, com isto, agora é necessário utilizar o modelo "gpt-4o"
O modelo "gpt-4-vision-preview" foi descontinuado, com isto, agora é necessário utilizar o modelo "gpt-4o"
Por hoje é isto, queridos desenvolvedores! 👩💼
Até logo! 👋