Control de Versiones con Mercurial (I) – Conceptos generales

by pachi

IntroducciÃ³n

En este artÃculo se hace una introducciÃ³n a los conceptos necesarios para el trabajo con sistemas de control de versiones. En particular, se orienta al aprendizaje de Mercurial, un sistema de control de versiones de Ãºltima generaciÃ³n y carÃ¡cter distribuido escrito por Matt Mackall.
El artÃculo forma parte de una serie que se publicarÃ¡ en este blog, y que se estructura de la siguiente manera:

I – Conceptos generales
II – Uso de Mercurial
III – PublicaciÃ³n de proyectos

Sistemas de control de versiones (VCS)

Mercurial es un programa que permite mantener un registro histÃ³rico de los cambios realizados en el contenido de un proyecto. Normalmente se utiliza en proyectos de software, pero se puede utilizar para otros propÃ³sitos (elaboraciÃ³n de documentos, archivo de la configuraciÃ³n de un sistema, etc).

Estos programas son conocidos como sistemas de control de versiones (VCS, por sus siglas en inglÃ©s), o sistemas de gestiÃ³n de cÃ³digo (SCM).

La gran ventaja de tener un registro de cambios es la posibilidad de recuperar versiones antiguas, visualizar los cambios hechos entre dos versiones, la seguridad de poder hacer pruebas sabiendo que se pueden deshacer los cambios, la capacidad de reconciliar cambios entre distintas «ramas» de un mismo proyecto, etc…

Sistemas de control de versiones centralizados y distribuidos (DVCS)

Tradicionalmente, y en los sistemas centralizados, el registro de cambios de un proyecto se almacenaba en un Ãºnico servidor, que contenÃa toda la informaciÃ³n de su historia, y del que dependÃan los distintos clientes para realizar operaciones que implicasen modificar o consultar la historia del proyecto. El gran problema de estos sistemas es que deja sin todos los beneficios del uso de un sistema de control de versiones a las personas que no tienen permiso de acceso (fundamentalmente de escritura) al servidor.

Una nueva generaciÃ³n de sistemas de control de versiones, conocidos como sistemas de control de versiones distribuidos, permiten que toda la informaciÃ³n acerca de la historia de un proyecto no haya de mantenerse en un Ãºnico archivo central. En estos sistemas cada copia del proyecto contiene esa informaciÃ³n, lo que permite que cada persona que trabaja con una copia disponga de todas las ventajas del control de versiones, y se facilita la colaboraciÃ³n, puesto que es posible relacionar los cambios realizados en diferentes copias, localizando su ancestro comÃºn a partir del cual se producen divergencias en el cÃ³digo comÃºn.

Este nuevo modelo favorece una participaciÃ³n mÃ¡s equitativa en equipos distribuidos y una organizaciÃ³n menos jerarquizada, sin impedir por ello la posibilidad de un funcionamiento similar al que exigen los sistemas centralizados.

Si bien puede parecer que el coste de mantener informaciÃ³n redundante en cada copia de un proyecto puede ser excesivo, en la prÃ¡ctica rara vez lo es, gracias al uso de tÃ©cnicas de compresiÃ³n y la similitud entre versiones sucesivas. AÃºn en proyectos muy grandes, con amplias historias de cambios, como el kernel Linux o FreeBSD, el espacio ocupado en disco para almacenar la historia de cambios no alcanza apenas al espacio ocupado por los archivos versionados.

Un poco de vocabulario: repositorios, conjuntos de cambios (Changeset) y estado del directorio (dirstate)

Mercurial registra la historia de un proyecto almacenando una especie de «instantÃ¡neas» del mismo en lo que se denomina «repositorio» (almacÃ©n, depÃ³sito).
Esas «instantÃ¡neas», llamadas Changeset o conjuntos de cambios, contienen la versiÃ³n en la que se encuentra cada uno de los archivos que se han «aÃ±adido» al repositorio, y son la pieza fundamental sobre la que se organiza Mercurial.

AsÃ, el changeset 235 podrÃa tener la versiÃ³n 1 del archivo leeme.txt, la versiÃ³n 5 del archivo COPYING, y no registra la existencia del archivo NEWS:

leeme.txt [versiÃ³n 1] COPYING [versiÃ³n 5]

Por otra parte, el changeset 236 contiene el archivo leeme.txt en la misma versiÃ³n (la 1), el archivo COPYING en la versiÃ³n 6, y ya ha aparecido el archivo NEWS, en su versiÃ³n 0:

leeme.txt [versiÃ³n 1] COPYING [versiÃ³n 6] NEWS [versiÃ³n 0]

El conjunto de changesets de un proyecto podrÃa ser algo asÃ:

Mercurial - historia lineal

donde 0 es el changeset incial y (236) el Ãºltimo changeset registrado. Cada uno de esos estados del proyecto se registra indicando de forma explÃcita al sistema de control de versiones que se desean registrar los cambios. A esta operaciÃ³n se le conoce como hacer un envÃo de cambios o «commit«.

Algunos sistemas de control de versiones usan bases de datos para estructurar la informaciÃ³n de los repositorios, pero, en Mercurial, un repositorio no es mÃ¡s que un directorio al que se aÃ±aden algunos metadatos. Estos metadatos los gestiona el sistema de forma transparente y automÃ¡tica, y estÃ¡n bÃ¡sicamente formados por los conjuntos de cambios del proyecto, ademÃ¡s de por el estado actual del directorio de trabajo o «dirstate«.

El «dirstate» es el changeset padre, o el changeset del cual parte el contenido actual del directorio de trabajo. Este dato resulta necesario, puesto que el contenido del directorio de trabajo puede corresponder a cualquiera de las versiones registradas del proyecto o a una versiÃ³n modificada de Ã©stas… ya que el sistema permite navegar por la historia del proyecto.

En el esquema anterior, el dirstate serÃa el changeset 236, y contendrÃa los siguientes archivos:

leeme.txt [versiÃ³n 1] COPYING [versiÃ³n 6] NEWS [versiÃ³n 0]

Si modificamos esos contenidos, el changeset padre del directorio de trabajo seguirÃa siendo el 236, aunque los contenidos no serÃan iguales a dicha versiÃ³n.

A la operaciÃ³n de recuperar en el directorio de trabajo una versiÃ³n cualquiera de las registradas en el repositorio se le conoce como «actualizar» a una versiÃ³n, y es una de las mÃ¡s Ãºtiles y habituales de las que permiten los sistemas de control de versiones.

En el ejemplo anterior, podrÃamos actualizar el directorio de trabajo a la versiÃ³n 235:

Mercurial - historia lineal

de manera que el dirstate corresponde al changeset 235, y el contenido del directorio de trabajo serÃa:

leeme.txt [versiÃ³n 1] COPYING [versiÃ³n 5]

Ramas, cabezas de desarrollo, reconciliaciÃ³n de cambios y tip

Hasta ahora hemos visto la historia de un proyecto como un registro lineal, pero lo mÃ¡s habitual es que se produzcan divergencias en la historia del mismo, dando lugar a lo que se conocen como «ramas» de desarrollo («branches»).

Un ejemplo de apariciÃ³n de divergencias es el siguiente:

Se publica una nueva versiÃ³n de un programa (v1.0 o changeset 212)
Se siguen registrando nuevas funcionalidades en proceso de desarrollo (hasta el changeset 215)
Surge un fallo inesperado en la versiÃ³n publicada que exige la publicaciÃ³n de una nueva versiÃ³n corregida
Se actualiza el directorio de trabajo a la versiÃ³n publicada (el dirstate cambia a 212)
Se aplican las correcciones necesarias y se registra y publica la nueva versiÃ³n (v1.1 o changeset 216)
Se actualiza el directorio de trabajo para seguir trabajando en las nuevas funcionalidades (el dirstate cambia a 215)
Se siguen aÃ±adiendo cambios (217)
En este proceso acabamos con dos ramas: una versiÃ³n incial mÃ¡s las nuevas funcionalidades (rama «en desarrollo«), una versiÃ³n inicial con correcciones de fallos (rama «estable«).

Mercurial - historia ramificada

Al changeset mÃ¡s reciente de cada rama se le conoce como cabeza (head) de la rama. En nuestro ejemplo serÃan los changeset 216 y el 217. Al changeset mÃ¡s reciente del repositorio se le conoce como tip, y al final del proceso de nuestro ejemplo, serÃa el changeset 217.

En el ejemplo anterior, es imaginable que se desee integrar los cambios de la rama «estable» en la rama en «desarrollo«.

Mercurial - historia ramificada y merging

A este proceso se le denomina reconciliaciÃ³n de cambios, mezcla de ramas, o «merging«, y Mercurial realiza esta operaciÃ³n aÃ±adiendo un nuevo changeset (218) que unifica dos changeset padre (normalmente las cabezas, en este caso 216 y 217), e incluye en Ã©l las modificaciones necesarias para reconciliar los cambios entre ellas.

NÃºmeros de revisiÃ³n, changeset ID y etiquetas

Hemos visto que la mayor parte de las operaciones, como la actualizaciÃ³n a una versiÃ³n determinada, o la mezcla de ramas, es necesario referirse a los changeset del repositorio. Para ello, Mercurial permite utilizar tres sistemas distintos: el nÃºmero de revisiÃ³n, el changeset ID, o un tag (etiqueta).

El nÃºmero de revisiÃ³n es simplemente un nÃºmero natural que corresponde al orden en el que se registrÃ³ del changeset en el repositorio. Es la forma que hemos usado hasta ahora en los ejemplos, pero presenta el problema de que no identifica de forma Ãºnica a un determinado changeset, sino que puede cambiar de mÃ¡quina a mÃ¡quina, en funciÃ³n de las diferencias en la historia de cada copia de un repositorio. Por ello no es Ãºtil mÃ¡s que para referirse a una copia concreta de un repositorio.

El changeset ID es un identificador Ãºnico para un changeset, que lo identifica en un punto concreto de la historia de un repositorio, y es indepediente de la mÃ¡quina en la que se sitÃºe. Permite referirse al mismo changeset en distintas copias de un repositorio. En Mercurial es un dato de 160bits, normalmente representado como una secuencia de 20 caracteres.

Una etiqueta (tag) es simplemente una cadena de texto que se liga a un changeset ID, y permite identificarlo de forma mÃ¡s conveniente. En nuestro ejemplo la etiqueta «v1.0» puede estar ligado al changeset ID: 58deccf0bead81a34691095db485a19efa1be709, que correspondÃa al nÃºmero de revisiÃ³n 212, mientras que el nÃºmero de revisiÃ³n 216 estÃ¡ marcado con la etiqueta «v1.1«. En los esquemas se seÃ±alan las etiquetas en cajas amarillas.

Mercurial - historia ramificada y merging

…y en el prÃ³ximo capÃtulo…

La prÃ³xima parte de esta serie de artÃculos tratarÃ¡ sobre la instalaciÃ³n y el uso prÃ¡ctico de Mercurial.

NOTA: El logo de Mercurial se distribuye bajo licencia GPL, segÃºn las condiciones establecidas en el sitio web de Mercurial

(c) Rafael Villar Burke 2006
Se permite la copia, distribuciÃ³n y modificaciÃ³n de este texto siempre que se conserve el copyright y esta nota.

"Control de Versiones con Mercurial (I) – Conceptos generales" was published on agosto 25th, 2006 and is listed in castellano, mercurial, programaciÃ³n, software-libre.

Follow comments via the RSS Feed | Leave a comment | Trackback URL

Control de Versiones con Mercurial (I) – Conceptos generales: 1 Comment

Mercurial: Sistema de control de versiones « Proyectos ArtOS wrote,

[…] algunos enlaces sobre como empezar a utilizar mercurial. https://blog.rvburke.com/2006/08/25/control-de-versiones-con-mercurial-i-conceptos-generales/ https://blog.rvburke.com/2006/09/08/control-de-versiones-con-mercurial-ii-uso-de-mercurial/ […]

Link | mayo 30th, 2010 at 12:08 am

RVBurke

Control de Versiones con Mercurial (I) – Conceptos generales

IntroducciÃ³n

Sistemas de control de versiones (VCS)

Sistemas de control de versiones centralizados y distribuidos (DVCS)

Un poco de vocabulario: repositorios, conjuntos de cambios (Changeset) y estado del directorio (dirstate)

Ramas, cabezas de desarrollo, reconciliaciÃ³n de cambios y tip

NÃºmeros de revisiÃ³n, changeset ID y etiquetas

…y en el prÃ³ximo capÃtulo…

Control de Versiones con Mercurial (I) – Conceptos generales: 1 Comment

Leave Your Comment

RVBurke

Control de Versiones con Mercurial (I) – Conceptos generales

IntroducciÃ³n

Sistemas de control de versiones (VCS)

Sistemas de control de versiones centralizados y distribuidos (DVCS)

Un poco de vocabulario: repositorios, conjuntos de cambios (Changeset) y estado del directorio (dirstate)

Ramas, cabezas de desarrollo, reconciliaciÃ³n de cambios y tip

NÃºmeros de revisiÃ³n, changeset ID y etiquetas

…y en el prÃ³ximo capÃ­tulo…

Control de Versiones con Mercurial (I) – Conceptos generales: 1 Comment

Leave Your Comment

…y en el prÃ³ximo capÃtulo…