Haces una red neuronal con un algoritmo de backpropagation, te la puedes aventar en python si tu server tiene el mod_python activado, o puedes pedir que suban la imagen al servidor, en tu servidor la procesas con una red neuronal en C++, analiza los datos y los regresa al explorador......
Ahora, para que proposito lo haces?
Que datos trae un acta de nacimiento??
Nombre, apellidos, fecha de nacimiento, nombre del juez, nombre del padre, nombre de la madre, fecha de nacimiento del padre, fecha de nacimiento del padre, nombre de dos testigos.
Que información es relevante para un usuario en cuestión?
Nombre completo y fecha de nacimiento.
Para que molestarse en escanear una imagen, procesar la imagen, subirla a un servidor todo para que se rellene "automaticamente" un formulario?
No es mas facil teclear los datos? Para que molestarse en tanto gasto innecesario de recursos?
Simplemente tu proyecto no le veo una aplicación real y útil.