primeiro de tudo: isso não teria que passar por conselho de ética não?
fora isso, a rigor, o que é público é público e ninguém pode te impedir de salvar o que quiser. mesmo assim, é de bom tom conseguir o consentimento de quem for afetado por esse scraping e deixar claro qual é o uso. muita gente pode se sentir exposta de ter todas suas conversas aleatórias salvas em um grande banco de dados. já fizeram coisa como um banco de dados público de busca por posts no fediverso inteiro e foi rechaçado com força.
seria de melhor tom ainda se você pedisse permissão para coletar os dados (opt-in) em vez de remover quem pedir (opt-out).