Publicaciones

En la presente sección se podrán encontrar los diferentes documentos publicados por el SI6.

  • "Collection and Publication of a Fixed Text Keystroke Dynamics Dataset", Luciano Bello, Maximiliano Bertacchini, Carlos Benitez, Juan Carlos Pizzoni y Marcelo Cipriano, 2010
    Resumen: Keystroke Dynamics is a powerful technique which allows to detect and identify intruders in computer systems. In order to test keystroke data pattern matching and clustering algorithms, user data collection is a mandatory task. Si6 Labs3 developed a web application named k-profiler with the purpose of collecting the typing rhythm data of volunteer users. This paper describes the experiment design criteria as well as the format of the collected data which will be used for Si6 projects and will be publicly available.
    Documento Completo (PDF) - Diapositivas de la presentación (PDF) - [BibTeX]

  • "User Clustering Based on Keystroke Dynamics", Carlos E. Benitez, Maximiliano Bertacchini y Pablo I. Fierens, 2010
    Resumen: The PAM clustering algorithm is applied on the Si6 keystroke dataset in order to identify sessions of the same users. A number of heuris- tical outlier filters based on statistical properties of keystroke latencies are proposed and run on the dataset. Different tests are performed vary- ing the number of digraphs that compose each observation and its dimen- sionality, in order to verify the assumption that more data gives a better quality of clustering and to estimate the minimum required number of dimensions. The number of clusters is estimated through the silhouette algorithm. Resulting clustering accuracy is measured by means of the F-measure, showing the viability of user identification through keystroke analysis.
    Documento Completo (PDF) - Diapositivas de la presentaón (PDF) - [BibTeX]

  • "Experiments on command dimension reduction in masquerader detection", Carlos E. Benitez y Pablo I. Fierens, 2009
    Resumen: We deal with the problem of dimension reduction in masquerader detection through command-line behavior. Although it has been previously suggested that unpopular commands are more relevant for this task, it is shown that there is no conclusive evidence in favor of this hypothesis. Moreover, it is also shown that selection of a fraction of the most popular or frequently used commands leads to a smooth degradation of a masquerader detection algorithm, while the selection of the most unpopular or infrequent commands produces a degradation which is worse than that of simple random selection. Some evidence is provided that the best performance of a masquerader detection algorithm may not necessarily correspond to accounting for all commands in the training data, but for a smaller, adequately chosen fraction of them. We verify this conclusion using two different datasets and two different masquerader detection algorithms. Finally, the empirical evidence provided in this paper suggests that, for many masquerader detection techniques, it may be convenient to work with a small fraction of the most popular or frequently used commands.
    Documento Completo (PDF)

  • "A Survey on Masquerader Detection Approaches", Maximiliano Bertacchini y Pablo I. Fierens, 2009
    Resumen: Este trabajo presenta una revisión del área de detección de masqueraders. Se analizan los tres conjuntos de datos públicos de comandos UNIX más populares y se comparan sus características. Se evalúan diferentes técnicas de detección de masqueraders y se comparan sus resultados aplicando las medidas de efectividad de detección más populares en el área, presentando la comparación cuantitativa más extensa de la literatura. Finalmente se proponen posibles caminos de trabajo a futuro en este área.
    Documento Completo (PDF)

  • "Análisis de las medidas de distancia entre sesiones para la clasificación de intrusos", Sebastián García, 2007
    Resumen: Este paper es una investigación en progreso enfocada al análisis de medidas de distancia entre sesiones de diversos intrusos, para la clasificación de los mismos mediante el estudio de su comportamiento. Se utilizan datos de intrusos reales, capturados durante los años 2005, 2006 y 2007 en diversos honeypots. Se estudia el comportamiento en referencia a las acciones del intruso, a su manera de utilizar el sistema y a sus intenciones. Los datos base corresponden a las teclas presionadas capturadas por un keylogger y no a datos de red como la dirección IP origen. El objetivo de este trabajo es lograr identificar y analizar las mejores medidas de distancia entre sesiones. En una primera instancia, las medidas de distancia seleccionadas permiten una clasificación satisfactoria.
    Documento Completo (PDF)

  • "NCD Based Masquerader Detection Using Enriched Command Lines", Maximiliano Bertacchini y Carlos E. Benitez, 2007
    Resumen: Este trabajo extiende una serie de experimentos realizados por Schonlau et al y Maxion sobre la detección de "masqueraders" (impostores o intrusos informáticos), y muestra la aplicación de un algoritmo de clasificación basado en técnicas de compresión llamado Normalized Compression Distance (NCD), desarrollado por Vitányi et al, sobre datos de línea de comandos UNIX, verificando que la utilización de datos "enriquecidos" en lugar de "truncados" mejora la precisión de los resultados obtenidos.
    Documento Completo (PDF)

  • "Preliminary Results on Masquerader Detection using Compression Based Similarity Metrics", Maximiliano Bertacchini y Pablo I. Fierens, 2006
    Resumen: Este trabajo extiende una serie de experimentos realizados por Schonlau et al. en relación a la detección de masqueraders informáticos (es decir, usuarios no legítimos intentando tomar la identidad de otros legítimos). Se aplica un algoritmo de clasificación basado en técnicas de compresión llamado Normalized Compression Distance o NCD, desarrollado por Vitanyi et al., al mismo juego de datos. Se muestra que la técnica basada en NCD arroja resultados similares a los de los métodos probados previamente por Schonlau et al. Asimismo se exponen posibles mejoras y direcciones de trabajo futuro sobre el tema.
    Documento Completo (PDF)

  • "Reducción de la latencia en las comunicaciones MPI utilizando GAMMA", Maximiliano Bertacchini y Alejandro Benabén, 2006
    Resumen: El presente trabajo tiene como propósito medir las diferencias de rendimiento entre la implementación de MPI de baja latencia MPI/GAMMA y la implementación estándar de MPI MPICH utilizando conexiones Fast-Ethernet en clusters de alto rendimiento. De acuerdo a las pruebas realizadas, hemos llegado a la conclusión de que la implementación de MPI/GAMMA presenta menor latecia y mejor utilización de la CPU respecto de la implementación MPICH.
    Documento Completo (PDF)

  • "Instalación de Servicios Proxy basados en Squid con autenticación NTLM", Flavio A. Fernández y Georgina Halladjián, 2004
    Resumen: El presente informe tiene como objetivo principal detallar los pasos necesarios para la instalación y configuración de un servidor proxy basado en software libre que permita la autenticación de los usuarios contra un Dominio NT.
    Para esta función, se eligió como solución la instalación de los servicios Squid, Samba y Winbind. El trabajo consiste en integrar las aplicaciones mencionadas anteriormente para ofrecer un acceso controlado a Internet utilizando el acceso al Dominio como único componete de autenticación.
    Documento Completo (PDF)