26 Décembre 2012
Pour cette partie, on va devoir créer une troixième colonne s'intitulant DUMP TEXT:
Voici le script :
#echo "Donnez le nom du dossier contenant les liens http : ";
#read dossier;
#echo "Donnez le nom du fichier html où stocker ces liens : ";
#read webPage;
dossier='./URLS/Anglais/sites.txt'
webPage='./TABLEAUX/Anglais/welcome1.html'
i=1
for sites in `ls $dossier`
{
y=1
echo "<th>Fichier $sites</th>">> $webPage
echo "<th>PAGES-ASPIREES</th>">> $webPage
echo "<th>PAGE DUMP</th>">> $webPage
for nom in `cat $sites`
{
wget -O ./PAGES-ASPIREES/$i.html $nom
lynx -dump $nom > ./DUMP-TEXT/$i.txt
echo "<tr><td><a href=\"$nom\" target=\"_blank\">$nom</a></font></td>" >> $webPage;
echo "<td><a href=\"../../PAGES-ASPIREES/$i.html\">PAGE ASPIREE</a></td>" >> $webPage;
echo "<td><a href=\"../../DUMP-TEXT/$i.txt\">PAGE DUMP</a></td></tr>" >> $webPage;
let "i+=1" ;
let "y+=1" ;
}
}
echo "</table></body></html>" >> $webPage;