Скачивание страниц и вложений из Сonfluence рекурсивно

# Рекурсивное скачивание списка страниц от текущей (Параметр parent необходимо изменить на ваш parentId, так же использовать свои данные в —user=* —password=* )

# Получаем файл json с описанием страниц, потом мы выбираем из него parentId дочерних страниц и сохраняем ID страниц в файл pageId.txt
wget -q —auth-no-challenge —user=your_name —password=your_password «http://confluence.*.ru/rest/api/content/search?cql=parent=90406760» -O list_pages.json
python -m json.tool list_pages.json | grep id | awk ‘{print $2}’ | tr -d \» | tr -d \, > pageId.txt

# Скачивание страниц в формате PDF по полученному списку ID.
while read PAGE_ID
do
wget -q —auth-no-challenge —user=* —password=* «http://confluence.*.ru/spaces/flyingpdf/pdfpageexport.action?pageId=$PAGE_ID» -O mypdf_$PAGE_ID.pdf
done < pageId.txt # Скачивание вложенных файлов # Узнаём имена файлов в первом цикле и закачиваем по этим именам файлы во втором цикле. while read PAGE_ID do wget --restrict-file-names=nocontrol --auth-no-challenge --user=* --password=* -q -O - http://confluence.*.ru/pages/viewpageattachments.action?pageId=$PAGE_ID | grep ?api=v2 | sed "s/.*download\/attachments\/$PAGE_ID\///" | tr -d \" > name_attachment.txt

while read ATTACHEMENT
do
ATTACHMENT_REAL=$(echo -e ${ATTACHEMENT//%/\\x})
wget —auth-no-challenge —user=* —password=* -q -O — http://confluence.*.ru/download/attachments/$PAGE_ID/$ATTACHEMENT -O «$(echo $ATTACHMENT_REAL| tr -d \?api=v2)»
done < name_attachment.txt rm -rf name_attachment.txt done < pageId.txt

Leave a Reply

Ваш e-mail не будет опубликован. Обязательные поля помечены *