La API Image Describer es una poderosa herramienta de generación de descripción de imágenes que produce de forma inteligente descripciones precisas, detalladas y perspicaces de imágenes basadas en la imagen y el prompt proporcionados. Esta API de reconocimiento de imágenes impulsada por IA entiende y analiza el contenido de la imagen, generando las descripciones textuales correspondientes de acuerdo con sus indicaciones. Es ampliamente aplicable a diversos escenarios que involucran comprensión de imágenes, análisis de imágenes y generación de contenido de imágenes, lo que le permite implementar fácilmente respuestas a preguntas sobre imágenes y conversión de imagen a texto.
La API Image Describer puede ayudarle a realizar de manera eficiente la comprensión de imágenes y la generación de contenido en las siguientes áreas:
Para acceder a la API Image Describer, primero debe obtener una clave API válida. Esta clave se utiliza para autenticar sus solicitudes y garantizar un acceso seguro a la API.
Importante: No la comparta con otros ni la exponga en el navegador, el código del lado del cliente ni en ningún otro lugar inseguro. Mantenga su clave segura para evitar el acceso no autorizado.
POST https://api.imagedescriber.app/api/v1/generate_content
Encabezado | Tipo | Obligatorio | Descripción |
---|---|---|---|
content-type | string | Sí | `application/json` |
authorization | string | Sí | `Bearer ${api_key}`, donde `${api_key}` es su clave API. |
{
"image": "data:image/jpeg;base64,{image_base64_data}",
"prompt": "¿Qué es este objeto? Describe sus posibles usos.",
"lang": "es"
}
Parámetro | Tipo | Obligatorio | Descripción |
---|---|---|---|
image | string | Sí | La URL o los datos codificados en Base64 de la imagen. Los formatos de imagen admitidos se enumeran en Detalles de Formato de Imagen. |
prompt | string | No | La pregunta o solicitud de descripción para la imagen, por ejemplo, "¿Qué es esto?" o "Describe esta imagen." |
lang | string | No | El código de idioma para la descripción devuelta. El valor predeterminado es `en` (inglés). Los códigos de idioma admitidos se enumeran a continuación. |
Código | Idioma |
---|---|
en | Inglés (Predeterminado) |
zh | Chino |
fr | Francés |
de | Alemán |
es | Español |
ja | Japonés |
ko | Coreano |
curl --location 'https://api.imagedescriber.app/api/v1/generate_content' \
--header 'content-type: application/json' \
--header 'authorization: Bearer your_api_key' \
--data '{
"image":"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQE...",
"prompt":"¿Qué es este objeto? Describe sus posibles usos.",
"lang":"es"
}'
import requests
import base64
def image_to_base64(image_path):
"""Convierte una imagen a codificación Base64"""
with open(image_path, "rb") as image_file:
encoded_string = base64.b64encode(image_file.read()).decode("utf-8")
return encoded_string
def generate_image_description(api_key, image_path, prompt, lang="es"):
"""Genera una descripción de imagen utilizando la API Image Describer"""
url = "https://api.imagedescriber.app/api/v1/generate_content"
headers = {
"content-type": "application/json",
"authorization": f"Bearer {api_key}"
}
image_base64_data = image_to_base64(image_path)
payload = {
"image": f"data:image/jpeg;base64,{image_base64_data}",
"prompt": prompt,
"lang": lang
}
response = requests.post(url, headers=headers, json=payload)
if response.status_code == 200:
result = response.json()
print(result["data"]["content"])
else:
print(f"Error: {response.status_code}")
print(response.text)
# Uso de ejemplo
api_key = "your_api_key"
image_path = "your_image.jpg"
prompt = "¿Qué es este objeto? Describe sus posibles usos."
generate_image_description(api_key, image_path, prompt, lang="es")
import fs from 'fs';
// Implementación del lado del servidor
const buffer = await fs.readFileSync("/temp/test.jpg");
const base64Image = buffer.toString('base64');
const imageData = `data:image/jpeg;base64,${base64Image}`;
// Implementación del lado del cliente
const file:File = /* archivo del evento de entrada o de soltar */;
const arrayBuffer = await file.arrayBuffer();
const bytes = new Uint8Array(arrayBuffer);
const base64Image = btoa(String.fromCharCode.apply(null, bytes as any));
const imageData = `data:${file.type};base64,${base64Image}`;
const body = {
"image": imageData,
"prompt": "Describe la imagen en detalle",
"lang": "es"
};
const response = await fetch('https://api.imagedescriber.app/api/v1/generate_content', {
method: 'POST',
headers: {
'Content-Type': 'application/json',
'Authorization': 'Bearer {your_api_key}'
},
body: JSON.stringify(body),
});
const result = await response.json();
console.log(result);
La API ahora devuelve la respuesta completa en un solo objeto JSON. El campo content
dentro del objeto data
contiene la descripción de la imagen generada en formato Markdown.
{
"code": 0,
"message": "éxito",
"request_id": "cadena_única_de_id_de_solicitud",
"data": {
"content": "Contenido generado en formato Markdown"
}
}
Campo | Tipo | Descripción |
---|---|---|
code | número | Código de estado, `0` indica éxito, no `0` indica un error. |
message | cadena | Mensaje de estado, describe el estado de la solicitud. |
request_id | cadena | ID de solicitud único, utilizado para seguimiento y solución de problemas. |
data | cadena | Contiene el contenido generado. Formato Markdown. |
content | cadena | El texto de la **descripción de la imagen** generada. El formato es **Markdown**. |
Para garantizar la estabilidad y la equidad del servicio, cada clave API está limitada a 5 solicitudes por minuto (300 solicitudes por hora). Las solicitudes que excedan este límite serán rechazadas con el código de error 1004
.
¿Cómo Obtener Más Créditos?
Puede visitar la Página de Recarga de Créditos para comprar paquetes de créditos para admitir más llamadas a la API. Ofrecemos varios paquetes para satisfacer las necesidades de diferentes usuarios.
La siguiente tabla enumera los códigos de error comunes, sus significados y soluciones:
Código de Error | Descripción | Solución |
---|---|---|
1002 | No Autorizado | Verifique que su encabezado `authorization` esté configurado correctamente. |
1003 | Clave API Inválida | Verifique que su clave API sea correcta u obtenga una nueva. |
1004 | Demasiadas Solicitudes | Reduzca la frecuencia de sus solicitudes, máximo 5 solicitudes por minuto. |
1005 | Parámetros Inválidos | Verifique que los parámetros de su solicitud cumplan con las especificaciones. |
2002 | Créditos Insuficientes | |
2003 | Contenido Bloqueado por el Filtro | Modifique su imagen o indicación para asegurarse de que el contenido cumpla con las regulaciones. |
2004 | Formato de Imagen Inválido | Utilice un formato de imagen compatible, consulte Detalles de Formato de Imagen. |
2005 | Error al Subir la Imagen | Verifique que la URL de su imagen sea válida o intente subirla de nuevo más tarde. |
5050 | Error Interno del Servidor | Póngase en contacto con nuestro equipo de soporte técnico y proporcione el `request_id`. |
Los formatos de imagen admitidos actualmente incluyen: JPG
, JPEG
, PNG
, WebP
. El tamaño máximo de imagen es de 4 MB.
Si tiene alguna pregunta o sugerencia, no dude en contactarnos a través de los siguientes métodos:
¡Comience a utilizar la API Image Describer ahora y desbloquee las posibilidades ilimitadas de la comprensión de imágenes!