Comandos de Busqueda

Comando ncdu

Comando find

Es el caso del comando find,

Uno de los legendarios de los sistemas Unix y por supuesto de las distribuciones Linux, y que permite realizar todo tipo de búsquedas de ficheros tanto por los nombre como por los distintos atributos que tienen esos mismos ficheros. En Linux.com han realizado un práctico tutorial con 10 consejos para usar find, y lo cierto es que este recorrido nos permitirá a buen seguro exprimir el funcionamiento de este comando. 1. Uso básico Lo normal es que utilicemos find para encontrar el nombre de un fichero en el directorio, no solo donde lo dejamos, sino cómo se llama ese fichero exactamente. Para ello basta con utilizar el formato

find -name nombredefichero

2. Búsqueda por tamaño A veces es importante encontrar ficheros por su tamaño, y para ello basta aplicar un parámetro:

find -size 100k

lo que permitiría buscar ficheros con un tamaño exacto de 100 kilobytes. Es probable que lo que queramos es encontrar ficheros con un tamaño superior o inferior a esa cifra en cuyo caso usaríamos

find size +100k

para los ficheros con mayor tamaño de 100k, y

find size -100

para ficheros de menor de 100k. Por cierto, si necesitamos buscar en gigabytes, basta con poner 100G, por ejemplo. 3. Búsqueda por usuario También podemos buscar ficheros que pertenecen a cierto usuario… o que no pertenecen a nadie y han quedado “huérfanos”, con la orden:

find -nouser

Si queremos buscar ficheros de alguien concreto usaremos las opciones -user o -uid. En este último caso deberemos saber el identificador de un usuario, algo que no es lo normal que sepamos, pero siempre viene bien tenerlo en cuenta. Además podemos buscar ficheros que pertenecen a un usuario A o a un usuario B con el parámetro -o, con lo que escribiríamos:

find -user root -o -user www-data

Y como era de esperar, también podemos buscar los ficheros que NO pertenecen a un usuario concreto:

find -not -user www-data

4. Búsqueda por grupo Lo mismo se podría aplicar a la búsqueda por grupos que puede afectar al nombre de grupo o al GID de ese grupo (con el mismo flag, cuidado), y haríamos un simple

find -group nombredelgrupo

(o giddelgrupo) Obviamente, podemos combinar esta opción con el resto de opciones, para por ejemplo encontrar ficheros que pertenecen a cierto grupo y que además pertenecen a cierto usuario dentro del grupo. 5. Búsqueda por permisos Uno de los usos más importantes de find -y probablemente de los más desconocidos- es su capacidad de encontrar ficheros con ciertos permisos, algo que nos permite detectar archivos que no tienen los permisos que deberían tener y que pueden suponer una amenaza para la seguridad del sistema. Las opciones más sencillas de usar son -readable, -writeable y -executable, aunque también podemos usar el parámetro -perm a partir del cual podemos establecer esos tres permisos a la vez con la típica combinación de tres números. Por ejemplo:

find -type f -perm -110

Buscaría ficheros con el bit de ejecutable activado para el usuario y el grupo, y el “-” le indica que ignore otros bits. O sea, que no importa si el fichero es de lectura o de escritura, porque lo que queremos es que aparezcan todos los que tienen ese bit de ejecución. Si queremos que específicamente se busquen ficheros que tengan el bit ejecutable para usuario y grupo usaríamos “/”, y no “-”:

find -type f -perm /110

Lo que buscaría solo aquellos ficheros con esos permisos, y no otros. 6. Usando expresiones regulares La potencia del comando find crece al usar las expresiones regulares (con la sintaxis tradicional regex) que permite aplicar estas potentes (pero complejas) expresiones para realizar búsquedas mucho más avanzadas. Podemos establecer este tipo de búsqueda con el parámetro -regextype, y luego alguno de los tipos de expresiones soportados con los parámetros posix-awk, posix-egrep, etc.  Consultad la página del manual para ampliar información. Por ejemplo si quisiéramos encontrar ficheros con extensión .php o .js haríamos lo siguiente:

find -regextype posix-egrep -regex '.*(php|js)$'

Al principio puede parece un poco complicado, pero si analizáis la expresión regular todo cobra sentido. La potencia que ofrecen las expresiones regulares es impresionante, pero ya solo este tema bastaría para un post dedicado a ellas. 7. Búsquedas por fechas Si quisiéramos encontrar ficheros por su edad, podríamos hacerlo también con tres parámetros específicos para estas tareas. Por tiempo de acceso (-atime), por última modificación (mtime) o por el último cambio de fichero (-ctime). Todas las cifras, expresadas en días, cuidado. Por ejemplo, busquemos ficheros que no hayan sido modificados en los dos últimos días

find -mtime +2

Podemos combinar las opciones y buscar ficheros en un rango, por ejemplo, ficheros que tengan entre 2 y 5 días de edad:

find -mtime +2 -mtime -5

8. Búsquedas por minutos Una especie de rama de lo anterior, pero que es importante porque trabaja con sus propios parámetros que son -amin, -cmin y -mmin, análogas a las que habíamos visto antes. Simplemente hay que tener en cuenta que en este caso la búsqueda es de cifras en minutos, no de días, lo que permite buscar con mucha mayor precisión en el tiempo. 9. Limitar las búsquedas A veces el comando find proporciona más resultados de los que necesitamos o queremos, y para limitar esos resultados podemos utilizar la opción -maxdepth. Por ejemplo, si queremos encontrar un archivo JavaScript en nuestro directorio wordpress, haríamos lo siguiente:

find wordpress -name "*js"

pero si solo quisiéramos buscar en el directorio de primer nivel haríamos

find wordpress -maxdepth 1 -name "*js"

Si quisiéramos buscar en el directorio y en la primera rama de subdirectorios habría que poner “-maxdepth 2″, y así sucesivamente según la profundidad de directorios en la que queremos buscar ficheros. 10. Combinando find con otros comandos Como era de esperar, es posible combinar find con otros comandos para construir potentes sentencias, por ejemplo en conjunción con xargs o con la opción -exec para manipular los ficheros tras haberlos encontrado. Por ejemplo, si quisiéramos cambiar los permisos de un puñado de ficheros de root al usuario www-data haríamos:

find -user root -exec chown www-data {} \;

Este comando hace que todos los ficheros que se encuentren y sean propiedad de root, sean utilizados por el comando chown para cambiarle el propietario. Como suele decirse, las posibilidades parecen ilimitadas. Pero como veis, find es un comando espectacularmente útil si se sabe usar con sabiduría.

FUENTE ORIGINAL

Comando grep

 

EL COMANDO GREP

El comando grep nos permite buscar, dentro de los archivos, las líneas que concuerdan con un patrón. Bueno, si no especificamos ningún nombre de archivo, tomará la entrada estándar, con lo que podemos encadenarlo con otros filtros.

Por defecto, grep imprime las líneas encontradas en la salida estándar. Es decir, que podemos verlo directamente la pantalla, o redireccionar la salida estándar a un archivo.

Como tiene muchísimas opciones, vamos a ver tan sólo las más usadas:

-c En lugar de imprimir las líneas que coinciden, muestra el número de líneas que coinciden.
-e PATRON nos permite especificar varios patrones de búsqueda o proteger aquellos patrones de búsqueda que comienzan con el signo -.
-r busca recursivamente dentro de todos los subdirectorios del directorio actual.
-v nos muestra las líneas que no coinciden con el patrón buscado.
-i ignora la distinción entre mayúsculas y minúsculas.
-n Numera las líneas en la salida.
-E nos permite usar expresiones regulares. Equivalente a usar egrep.
-o le indica a grep que nos muestre sólo la parte de la línea que coincide con el patrón.
-f ARCHIVO extrae los patrones del archivo que especifiquemos. Los patrones del archivo deben ir uno por línea.
-H nos imprime el nombre del archivo con cada coincidencia.

Veamos algunos ejemplos:

- Buscar todas las líneas que contengan palabras que comiencen por a en un archivo:
$ grep '\<a.*\>' archivo

Otra forma de buscar, sería:
$ cat archivo | grep "\<a.*\>" 

- Mostrar por pantalla, las líneas que contienen comentarios en el archivo /boot/grub/menu.lst:
$ grep "#" /boot/grub/menu.lst

- Enviar a un fichero las líneas del archivo /boot/grub/menu.lst que no son comentarios:
$ grep -v "#" /boot/grub/menu.lst

- Contar el número de interfaces de red que tenemos definidos en el fichero /etc/network/interfaces:
$ grep -c "iface" /etc/network/interfaces

- Mostrar las líneas de un fichero que contienen la palabra BADAJOZ o HUELVA:
$ grep -e "BADAJOZ" -e "HUELVA" archivo

- Mostrar las líneas de un fichero que contienen la palabra BADAJOZ o HUELVA, numerando las líneas de salida:
$ grep -n -e "BADAJOZ" -e "HUELVA" archivo

- Mostrar los ficheros que contienen la palabra TOLEDO en el directorio actual y todos sus subdirectorios:
$ grep -r "TOLEDO" *

Veamos algunos ejemplos con expresiones regulares:

- Obtener la dirección MAC de la interfaz de red eth0 de nuestra máquina:
$ ifconfig eth0 | grep -oiE '([0-9A-F]{2}:){5}[0-9A-F]{2}'

Sacamos la dirección MAC de la interfaz eth0 de nuestra máquina haciendo un:
ifconfig eth0

Y aplicando el filtro grep:
grep -oiE '([0-9A-F]{2}:){5}[0-9A-F]{2}'

Las opciones que he usado en grep son:

-o Indica que la salida del comando debe contener sólo el texto que coincide con el patrón, en lugar de toda la línea, como es lo habitual.
-i Lo he usado para que ignore la distinción entre mayúsculas y minúsculas.
-E Indica que vamos a usar una expresión regular extendida.

En cuanto a la expresión regular, podemos dividirla en dos partes:
([0-9A-F]{2}:){5} Buscamos 5 conjuntos de 2 carateres seguidos de dos puntos
[0-9A-F]{2} seguido por un conjunto de dos caracteres.

Como las direcciones MAC se representan en hexadecimal, los caracteres que buscamos son los números del 0 al 9 y las letras desde la A a la F.

- Extraer la lista de direcciones de correo electrónico de un archivo:
grep -Eio '[a-z0-9._-]+@[a-z0-9.-]+[a-z]{2,4}' fichero.txt

Utilizo las mismas opciones que en el caso anterior:

-o Indica que la salida del comando debe contener sólo el texto que coincide con el patrón, en lugar de toda la línea, como es lo habitual.
-i Lo he usado para que ignore la distinción entre mayúsculas y minúsculas.
-E Indica que vamos a usar una expresión regular extendida.

Analicemos ahora la expresión regular:
[a-z0-9._-]+@[a-z0-9.-]+[a-z]{2,4}

Al igual que antes, la vamos dividiendo en partes:
[a-z0-9._-]+ Una combinación de letras, números, y/o los símbolos . _ y - de uno o más caracteres
@ seguido de una arroba
[a-z0-9.-]+ seguido de una cadena de letras, números y/o los símbolos . y -
[a-z]{2,4} seguido de una cadena de entre dos y cuatro caracteres.

- Obtener la dirección IP de la interfaz de red eth1 de nuestra máquina:
$ ifconfig eth1 | grep -oiE '([0-9]{1,3}\.){3}[0-9]{1,3}' | grep -v 255

En el ejemplo anterior, hemos tomado la información que nos ofrece ifconfig:
ifconfig eth1

Hemos filtrado dicha información con el comando grep, obteniendo todas las direcciones IP que aparecen:
grep -oiE '([0-9]{1,3}\.){3}[0-9]{1,3}'

Por último, hemos filtrado la salida del comando anterior, para eliminar la dirección de broadcast junto con la máscara de red para quedarnos sólo con la dirección IP de la máquina:
grep -v 255

La línea anterior no mostraría las líneas que no contengan el valor 255, es decir, las direcciones de broadcast y máscara de red.

Analicemos ahora el comando grep:
grep -oiE '([0-9]{1,3}\.){3}[0-9]{1,3}'

Al igual que en los otros dos ejemplos de expresiones regulares uso las opciones -oiE en el comando grep:

-o Indica que la salida del comando debe contener sólo el texto que coincide con el patrón, en lugar de toda la línea, como es lo habitual.
-i Lo he usado para que ignore la distinción entre mayúsculas y minúsculas.
-E Indica que vamos a usar una expresión regular extendida.

En cuanto a la expresión regular:
'([0-9]{1,3}\.){3}[0-9]{1,3}'
([0-9]{1,3}\.){3} Representa 3 bloques de entre uno y tres dígitos separados por puntos. Observemos que como el punto es un metacaracter, tengo que usar el caracter de escape \ para que no sea interpretado como un metacaracter, sino como un caracter normal.
[0-9]{1,3} Representa el último bloque de la dirección IP, que está formado por un número de entre 1 y 3 dígitos.

FUENTE ORIGINAL

Comando locate

 

Hasta el momento de escribir esta entrada, no recuerdo haber utilizado el comando locate con argumentos. Creo que mucha gente hace lo mismo así que vamos a ver unos cuantos ejemplos para ampliar un poco las posibilidades de este comando.

Como muchos ya sabéis, el comando locate permite hacer búsquedas de una cadena de texto en todo el sistema de forma prácticamente instantánea. Estas búsquedas no se hacen directamente contra los filesystem sino contra una base de datos (/var/lib/mlocate/mlocate.db) que se actualiza periódicamente mediante updatedb (en un cron). Dependiendo de la periodicidad de actualización de la base de datos los resultados serán más o menos fiables.

Vamos a ver unos ejemplos de argumentos que podemos pasar al comando locate para ampliar su funcionalidad.

Contar el número de resultados

Con el parámetro “-c” se muestra por pantalla el número de resultados de la consulta en lugar de la lista de ficheros y directorios:

locate -c .conf
1681

Buscar un nombre exacto

locate conf

En el caso anterior se mostrarán resultados tal que:

/tst/conf
/tst/confaaaa
/conf/test/prueba
/test/conf.test/prueba

... Para solucionarlo modificamos el comportamiento por defecto (–wholename) por –basename o “-b”, de modo que los resultados harán referencia únicamente al base name, o lo que es lo mismo, el último componente del path:

locate -b  "\conf"
/usr/share/speech-dispatcher/conf
/usr/src/linux-headers-3.2.0-23-generic/scripts/kconfig/conf

Hemos añadido la contrabarra para evitar convertir “conf” en el comportamiento por defecto de wildcards “*conf*”. Buscar con expresiones regulares: Podemos construir la búsqueda a partir de expresiones regulares. Eso sí, usando regexp no podemos incluir patrones (la cadena de texto), sólo la expresión regular. Podemos usar –regexp o -r:

locate -r .*info.*\.conf.*ms$
/var/lib/dpkg/info/dconf-gsettings-backend:i386.md5sums
/var/lib/dpkg/info/dconf-service.md5sums
/var/lib/dpkg/info/debconf-i18n.md5sums

... Resultados sensibles a mayúsculas/minúsculas El parámetro “-i” nos permite indicar que los resultados hagan caso omiso a mayúsculas/minúsculas. Búsqueda de resultados reales Como decía antes, locate utiliza una base de datos para hacer las consultas, no hace uso de los filesystem. Para evitar incongruencias en los resultados, por ejemplo con ficheros que ya han sido borrados y el comando updatedb no ha sido ejecutado todavía, utilizamos el parámetro –existing o -e:

locate -e conf

Como siempre, si os es interesante podéis revisar la página man de locate para encontrar más funcionalidades:

man locate

FUENTE ORIGINAL

Comando whereis

Comando whereis

Este comando se utiliza para localizar el archivo binario, el código fuente y la página de manual de un determinado comando.

Su sintaxis es como sigue:

whereis [opciones] archivo...

La lista de opciones mas utilizadas es:

-b
Buscar solamente el archivo binario.
-m
Buscar solamente la página manual.
-s
Buscar solamente el código fuente.
 

 

FUENTE ORIGINAL